AlphaZeroの意外な構造　またはAlphaGoは如何にして棋譜データの利用を止めて自分の経験に頼るようになったか

囲碁ＡＩの強化学習アルゴリズム：AlphaGoから、人の知識なしでゼロから学習に成功した強化学習モデルのゲームＡＩ「AlphaZero」を、初心者・中級者向けに実行教材とイラストで解説していきます。将棋ＡＩとしても成果を出しています。

Ratings: 4.16 / 5.00

Description

AlphaGoは大量のプロの棋譜データを集めて教師あり学習をさせていましたが、その後発表されたAlphaGoZeroは、プロの棋譜データなしで、まるで赤ちゃんのような状態から学習を始めてAlphaGoに勝つようになりました。さらに、AlphaGoZeroをより汎用的に改良したAlphaZero は大変シンプルな構造となっていて、強化学習初心者でも学びやすくなっています。

AlphaZeroは、Googleの巨大なネットワークの中で学習されたゲームＡＩですので、１台のマシンでは学習できませんが、論文に基づくコードを動かしながら、人の知識なしでゼロから学習を始めるAlphaZeroの構造を、強化学習の観点から、豊富な図とPythonプログラミングで楽しく学んでいきましょう。

前半には、チェス・マシン「Deep Blue」についての解説もあります。

What You Will Learn!

AlphaGo ZeroとAlphaZero の仕組みを強化学習を通して説明できるようになります。
AlphaZeroに至るまでの歴史的経緯をたどることができます。
AlphaZeroを通して、ニューラルネットワークやディープラーニングの概要を理解します。
Pythonコードに触れることができます。（初心者向け）

Who Should Attend!

人工知能（ＡＩ）に興味をもつ方
ゲームＡＩの仕組みに興味のある方
AlphaZeroの仕組みを詳しく理解したい方
ディープラーニングを一通り受講された方、またはこれからディープラーニングを始めたい方

AlphaZeroの意外な構造 またはAlphaGoは如何にして棋譜データの利用を止めて自分の経験に頼るようになったか

Description

What You Will Learn!

Who Should Attend!

AlphaZeroの意外な構造　またはAlphaGoは如何にして棋譜データの利用を止めて自分の経験に頼るようになったか