AlphaZeroの意外な構造 またはAlphaGoは如何にして棋譜データの利用を止めて自分の経験に頼るようになったか
囲碁AIの強化学習アルゴリズム:AlphaGoから、人の知識なしでゼロから学習に成功した強化学習モデル のゲームAI「AlphaZero」 を、初心者・中級者向けに実行教材とイラストで解説していきます。将棋AIとしても成果を出しています。
Description
AlphaGoは大量のプロの棋譜データを集めて教師あり学習をさせていましたが、その後発表されたAlphaGoZeroは、プロの棋譜データなしで、まるで赤ちゃんのような状態から学習を始めてAlphaGoに勝つようになりました。さらに、AlphaGoZeroをより汎用的に改良したAlphaZero は大変シンプルな構造となっていて、強化学習初心者でも学びやすくなっています。
AlphaZeroは、Googleの巨大なネットワークの中で学習されたゲームAIですので、1台のマシンでは学習できませんが、論文に基づくコードを動かしながら、人の知識なしでゼロから学習を始めるAlphaZeroの構造を、強化学習の観点から、豊富な図とPythonプログラミングで楽しく学んでいきましょう。
前半には、チェス・マシン「Deep Blue」についての解説もあります。
What You Will Learn!
- AlphaGo ZeroとAlphaZero の仕組みを強化学習を通して説明できるようになります。
- AlphaZeroに至るまでの歴史的経緯をたどることができます。
- AlphaZeroを通して、ニューラルネットワークやディープラーニングの概要を理解します。
- Pythonコードに触れることができます。(初心者向け)
Who Should Attend!
- 人工知能(AI)に興味をもつ方
- ゲームAIの仕組みに興味のある方
- AlphaZeroの仕組みを詳しく理解したい方
- ディープラーニングを一通り受講された方、またはこれからディープラーニングを始めたい方