強化学習は、報酬を与える条件を設定し、与えられる報酬が最大となるように何度も試行を重ね強化していく、遺伝的アルゴリズムの一種です。顔画像の自動生成サービスや各種ゲームAI、自動運転ソフトの開発などで使われています。
この例のように、学習を進めていくにつれ、徐々に賢くなっていることが分かります。ただ、現状のアルゴリズムでは、これ以上行っても、なかなかうまくいかない・・・。