大規模言語モデル(LLM)の仕組み入門【ChatGPT/GPT-4/Transformer】
大規模言語モデル(LLM)の背景にある仕組みをコンパクトに学ぶ講座です。ニューラルネットワークの基礎、Transformerの基礎を学んだ上で、ChatGPTなどの仕組みを学びます。生成AIの動作の裏側を想像できるようになりましょう。
Description
「大規模言語モデル(LLM)の仕組み入門」は、ChatGPTなどで使われている大規模言語モデル(Large Language Model、LLM)の仕組みについて学ぶ講座です。
GPT-4などのLLMがどのようにして前世代のモデルを超え、AIの未来を切り開いているのかを掘り下げていきます。
可能な限り難しい数学は使わず、LLMのコードを実行する体験と共にLLMの基礎を学んでいきます。
LLMは現在様々な分野で驚異的な性能を発揮し、幅広く活用されています。
特にGPT-3.5やGPT-4が使われているChatGPTは、自然言語を使った対話により自然な文章を生成可能なので、大きな注目を集めています。
また、LLMは様々なタスクをこなせる汎用性を備えており、これまで人間しかできなかった様々なタスクを任せることが可能になってきています。
この講座では、LLMの概要を学んだ上で、ニューラルネットワークの基礎、Transformerへの発展、LLMの躍進について順を追って学んで行きます。
世界に巨大なインパクトを与えつつあるLLMの背景を、想像し活用できるようになりましょう。
注: 本コースに先立ちYouTubeでのライブ講義【Live! 人工知能】がありました。本コースの動画はこのライブ講義をUdemy用に再構成したものになります。
講座の内容は以下の通りです。
Section1. LLMの概要
→ LLMの概要や、開発環境について学びます。
Section2. ニューラルネットワークの仕組み
→ ニューラルネットワークの概要、そして学習の仕組みについて学びます。
Section3. Transformerの仕組み
→ LLMのベースであるTransformerの仕組みについて学びます。
Section4. LLMの仕組み
→ LLMの仕組みについて解説します。また、ライブラリを使った実装も行います。
なお、今回の講座でプログラミング言語Pythonの解説は最小限となりますが、Pythonの基礎を解説するノートブックを予め配布します。
Pythonの開発環境にはGoogle Colaboratoryをメインで使用します。
What You Will Learn!
- 大規模言語モデル(LLM)の仕組みを基礎から学びます。
- ニューラルネットワーク、TransformerなどのLLMのベースを基礎から学びます。
- Pythonで書かれたLLMのコードを実行し、文章を生成する体験をします。
- 難しい数式やコード無しで、大規模言語モデル(LLM)の概要、全体像を把握できます。
Who Should Attend!
- ChatGPTなどの動作原理を基礎から知りたい方。
- 大規模言語モデル(LLM)の全体像を知りたい方。
- 大規模言語モデル(LLM)に興味があるけど、学び方が分からない方。
- 仕事上、大規模言語モデル(LLM)の知識が必要になった方。
- AI技術のトレンドに追随したい方。