AlphaZeroの意外な構造 またはAlphaGoは如何にして棋譜データの利用を止めて自分の経験に頼るようになったか

囲碁AIの強化学習アルゴリズム:AlphaGoから、人の知識なしでゼロから学習に成功した強化学習モデル のゲームAI「AlphaZero」 を、初心者・中級者向けに実行教材とイラストで解説していきます。将棋AIとしても成果を出しています。

Ratings: 4.16 / 5.00




Description

AlphaGoは大量のプロの棋譜データを集めて教師あり学習をさせていましたが、その後発表されたAlphaGoZeroは、プロの棋譜データなしで、まるで赤ちゃんのような状態から学習を始めてAlphaGoに勝つようになりました。さらに、AlphaGoZeroをより汎用的に改良したAlphaZero は大変シンプルな構造となっていて、強化学習初心者でも学びやすくなっています。

AlphaZeroは、Googleの巨大なネットワークの中で学習されたゲームAIですので、1台のマシンでは学習できませんが、論文に基づくコードを動かしながら、人の知識なしでゼロから学習を始めるAlphaZeroの構造を、強化学習の観点から、豊富な図とPythonプログラミングで楽しく学んでいきましょう。

前半には、チェス・マシン「Deep Blue」についての解説もあります。

What You Will Learn!

  • AlphaGo ZeroとAlphaZero の仕組みを強化学習を通して説明できるようになります。
  • AlphaZeroに至るまでの歴史的経緯をたどることができます。
  • AlphaZeroを通して、ニューラルネットワークやディープラーニングの概要を理解します。
  • Pythonコードに触れることができます。(初心者向け)

Who Should Attend!

  • 人工知能(AI)に興味をもつ方
  • ゲームAIの仕組みに興味のある方
  • AlphaZeroの仕組みを詳しく理解したい方
  • ディープラーニングを一通り受講された方、またはこれからディープラーニングを始めたい方