AIエンジニアが教えるRとtidymodelsによる機械学習と予測モデリング
データ分析プロジェクトの最重要タスクである予測モデリングの効率的なやり方を現役AIエンジニアの立場からわかりやすく説明します.
Description
※ 本コースはRとtidyvverseが未経験でも受講できますが,Rとtidyverseの基本的な知識があるとより一層理解が深まります.
本コースは,予測モデリングに特化しています.
予測モデリングとは,データから予測したい項目を予測する技術のことです.
ビジネスにはとにかく不明確な問題が多いです.
例えば
この部品の状態は正常か異常か??
今週の来客数はどれくらいだろうか??
この製品はいつ頃出荷できるのだろうか??
みたいなことが挙げられます.
このような問題に対し,答えとなる予測値を算出する技術が予測モデリングです.
例えば
この部品の状態は正常か異常か??という問題に対し,異常と予測できれば,異常と予測した部品の出荷を取りやめるという方針が取れます.
このようにとある問題に対し,正確な予測ができるとビジネスにおいて有利な方針を取ることができるのです!
そんな予測モデリングをするためのパッケージとしてPythonのscikit-learnが有名ですが,Rにもtidymodelsというパッケージがあります.
tidymodels,ちょっと聞きなれないかもしれませんが,実は予測モデリングのパッケージとしてとても優秀なんです!
予測モデリングにRとtidymodelsを使用するメリットは以下になります.
・連携性:tidymodelsはtidyverseと相性がよく,前処理⇔モデリングの行き来をスムーズでできるため,効率的にデータ分析プロジェクトを実施することができる!!
・収納性:構築したモデルをデータフレームに格納できる!!
・統一性:分析コンペで人気のアルゴリズムである勾配ブースティング(XGBoost, LightGbm, CatBoost)のパッケージを統一的な文法で扱える!!
・一貫性:tidymodelsだけで,データ分割,学習ルール選定,特徴量エンジニアリング,ハイパラチューニング,モデル検証といった予測モデリングのワークフローを実現できる!!
本コースは,tidymodelsを利用し,予測モデリングのワークフローを習得することを目指します!
★本コースの目的★
機械学習の典型的な利用方法を学習し,データから予測したい項目をtidymodelsを使用して予測できるようにすること!!
★本コースの特徴★
とにかく現場主義!!
コーディングはライブ形式!!
コードだけでなく,イメージも!!
★本コースの内容★
コース紹介
概要
モデリングと予測モデリング
なぜPythonのscikit-learnではなくRのtidymodelsなのか
全体像
機械学習と予測モデリング
概要
機械学習
STEP1:探索的データ分析
STEP2:データ分割
STEP3:学習ルール選定
STEP4:特徴量エンジニアリング
STEP5:ハイパラチューニング
STEP6:モデル検証
環境構築
概要
Rのインストール
RStudioのインストール
RStudioの設定
プロジェクトファイルの作成
パッケージのインストール
.Rprofileの作成
tidymodels
概要
{tidyverse}探索的データ分析
{rsample}データ分割
{parsnip}学習ルール設定
{recipes}特徴量エンジニアリング
{workflows}レシピ+学習ルール
{tune},{dials}ハイパラチューニング
{yardstick}モデル評価
{broom}モデル整理
{DALEX}モデル解釈
総合演習
概要
STEP1:探索的データ分析
STEP2:データ分割
STEP3:学習ルール選定
STEP4:特徴量エンジニアリング
STEP5:ハイパラチューニング
STEP6:モデル検証
総括
まとめ
What You Will Learn!
- データ分析プロジェクトにおける予測モデリングの重要性
- Rとtidymodelsを使用するメリット
- 機械学習と予測モデリングの概要
- tidymodelsによる予測モデリングの具体的な方法
Who Should Attend!
- データサイエンス,AI,機械学習に興味がある方
- scikit-learnで機械学習に挫折した方
- Rで機械学習をしてみたい方
- tidymodelsの使い方がよくわからない方