データサイエンス実戦講座[第4回]ベイズ統計の基礎と”量が質を凌駕する”パラレルワールド

近年、統計学の主流となりつつあるベイズ統計学について、基本的な考え方をわかりやすく徹底的に解説します。ベイズの定理に集約された概念は、機械学習やAIとの親和性が高く、データサイエンスの世界の共通言語を習得することができます。

Ratings: 4.87 / 5.00




Description

ベイズ統計学の理解するうえで重要な3つのポイントを解説します。

1) パラレルワールドの統計学:頻度論とベイズの世界観の違いから、分析目標は同じでもアプローチが真逆になることを把握します。

2.ベイズの定理:定理の意味を理解し、原因の究明、仮説の検証、母集団の特徴量の分布推定に拡張するロジックを学習します。

3.ベイズ推定:新たにデータを得るたびに母数の確率分布を逐次推定するロジックを理解し、統計分析ソフトJASPを用いて現実の問題に適用するスキルを習得します。

What You Will Learn!

  • 自然現象や社会現象のメカニズムを分析するデータサイエンスの様々な手法について、複数のコースに分けて1つずつ習得していきます。古典的な頻度論の統計学から最新のディープラーニングまで、原理の理解と実務への応用を目指します。
  • 近年、注目を集めているベイズ統計学の基礎を学習します。現象を分析するという目的は頻度論の統計学と同じですが、ベイズでは母集団と標本の捉え方が真逆で、パラレルワールドの統計学という視点で見ると理解がしやすくなります。本コースではその基本原理を詳しく解説します。
  • 頻度論の世界観では現象の特徴量を指す母数は未知の真値で、標本データを分析することで母数の存在範囲と観測頻度を推定します。一方、ベイズ統計では母数は確率変数で、データを集めて分析を重ねることで母数の確率密度分布を推定精度が高くなります。これが”量が質を凌駕する”の意味で、機械学習やAIにも通じる概念を学びます。
  • パラレルワールドを支配するベイズの定理について学びます。本来は2つの事象に関する条件付き確率の交換法則ですが、これを原因と結果、仮説とデータ、事前分布と事後分布の関係式に拡張することで、結果から原因の究明、データから仮説の検証、母数の初期分布(事前分布)から母数の確率密度分布(事後分布)の推定が可能になります。
  • データを観測するたびに母数の確率密度分布を逐次推定するベイズ推定の基本原理について解説します。共役分布を用いて解析的に推定する手法と、マルコフ連鎖モンテカルロ(MCMC)法を用いて数値近似する手法があり、例題と面白いクイズを通じて理論の理解と統計分析についての認識を深めます。

Who Should Attend!

  • 学業や業務でデータ分析を必要としている方、将来データアナリストを目指す方、データサイエンスに興味のある方であればどなたでも。 データ分析の初心者から学び直しの中級者。