データサイエンス実戦講座[第1回]統計学の基礎と「統計的有意性」の終焉
統計学の基礎から最新の機械学習やディープラーニングまで、データサイエンスの多種多様な手法を学んで研究開発やビジネスの問題を解決する能力を獲得しよう
Description
データサイエンスには科学という名称が付いていますが、真理を探究するといった学問ではありません。問題を解決して対策を実行するための意思決定と行動選択の根拠を与えてくれる、有能な道具であり強力な武器です。道具や武器は使ってこそ意味があります。分析手法を勉強して理解するところで満足せず、大学の研究や企業の実務で直面する現実の問題を解決する実戦力を獲得することが本講座の目的です。
データサイエンスには、百年前に生まれた統計学から近年その価値が再認識されているベイズ統計学、注目の機械学習やディープラーニング、最先端のチャットボット技術まで、多種多様なデータ分析手法があります。残念ながら万能な手法というものはないので、多くの手法をマスターする必要があります。そして、積極的に複数の分析手法を適用することで、複雑な問題を様々な角度から解明して、本質に迫ることが可能になります。
本講座では、複雑な数式やプログラミングはできるだけ避け、フリーのデータ分析ソフトを利用して実務レベルの演習問題を解いてゆくことで実戦力を養います。
What You Will Learn!
- 改訂しました(2024/3/14)。映像と音声をすべて録り直しました。講義内容は基本的に変えていませんが、細部を手直ししました。自然現象や社会現象のメカニズムを分析するデータサイエンスの様々な手法について、複数のコースに分けて1つずつ習得していきます。
- 第1回目のコースは統計学の基礎です。母集団と標本、記述統計と推測統計、さまざまな確率分布、中心極限定理、平均値や分散の推定、仮説検定などについて、頻度論の考え方に基づく統計学の基礎理論を丁寧に解説します。
- 頻度論による統計学は今から100年ほど前に生まれました。コンピュータなど無い時代なので、統計学者は数学的に扱えるように様々な仮定のもとに理論を構築しました。例えば母集団は正規分布している等ですが、実際の現象には当てはまらないケースもあります。分析手法の前提条件と現実の問題に適用する上での注意点について学習します。
- いま大きな話題になっているのが仮説検定です。アメリカ統計協会(ASA)は2016年に発表した「p値に関する声明」の中でp値の誤用が多いことに注意を喚起しており、2019年には機関誌で“統計的に有意と言うのはやめよう”と提言しています。p値の意味と検定結果の正しい解釈を学びます。
- すべてのコース、または、あなたに必要なコースを選択し、実務レベルの演習問題を解いていくことで、大学での研究や企業のビジネスの現場で遭遇する問題に対して、最善の意思決定と行動選択を可能にするデータ分析という強力な武器を手に入れることができます。
Who Should Attend!
- 学業や業務でデータ分析を必要としている方、将来データアナリストを目指す方、データサイエンスに興味のある方であればどなたでも。
- データ分析の初心者から学び直しの中級者。