AIエンジニアが教えるRとtidyverseによるデータの前処理講座
データ分析プロジェクトで避けては通れないデータの前処理の効率的なやり方を現役AIエンジニアの立場からわかりやすく説明します.このコースを受講することにより,データの前処理のほぼすべて(80%程度)に対応することができます.
Description
※当コースでは当初,Dockerを導入しておりましたが,Dockerは無償でご利用いただける条件が変更され、環境によっては有料ライセンスが必要となるようになりました.
つきましては,当コースにおける環境構築は,Dockerではなく,RとRStudioを直接ご自身のPCにインストールするよう,お願いいたします.
本コースは,データの前処理に特化しています.
近年はAIが話題になっており,実に様々な方々が興味を持っている分野だと思います.
AIによる成果に焦点が当たる場合が多いですが,その成果が出る前には必ずデータの前処理をする必要があります.
データの前処理は,データの読み込み,加工,結合,可視化など実に様々な工程を何回も繰り返すことで,徐々に完成に近づいていきます.
そのことが原因で,データの前処理には多大な時間(データ分析プロジェクト全体の70%~80%程度)が費やされるのです.
そんな多大な時間が費やされるデータの前処理ですが,後工程の成果物につながる重要な工程ですので,できるだけ速く正確に実施する必要があります.
さて,一般的にデータの前処理に使用されるプログラミング言語はPythonですが,前処理を速く正確に実施することはできるのでしょうか?
実は,Pythonはもともとシステム開発用の言語なので,データの前処理には向いておりません.
(実際に私もPythonやPandasでデータの前処理に挑んだこともありましたが,複雑すぎて挫折したことがあります...)
それではどうすればデータの前処理を速く正確に実施することができるのでしょうか?
私が考えるベストソリューションは,データの前処理に特化したRのパッケージ{tidyverse}を利用することです.
Pythonで複雑になりがちなコーディングもRの{tidyverse}を使用すると,とても簡潔かつ流れるようにコーディングすることができるのです!!
よって本コースでは,{tidyverse}の使い方を詳細に説明します.
また{tidyverse}だけでなく,環境構築やRの基礎についても丁寧に説明しますので,今までプログラミングをしたことがない初心者でも全く問題ないです.
講師が基礎から丁寧に解説しますので,気楽に一歩一歩着実に学習し,前処理マスターを目指しましょう!!
★本コースの目的★
データの前処理のほぼすべて(80%程度)に対応すること
★本コースの特徴★
とにかく現場主義!!
コーディングはリアルタイム形式!!
コードだけでなく,イメージも!!
★本コースの内容★
コース紹介
概要
なぜPythonではなくRのtidyverseなのか
全体像
環境構築
Docker
Rstudio
baseR(普通のR言語のこと)
データ型
ベクトル
論理値ベクトルの処理
リスト
データフレーム
関数
tidyverse
パイプ処理(%>%)
{tibble}データフレームの進化版
{dplyr} データフレーム処理
{tidyr} tidyデータ処理
{ggplot2} 可視化
{stringr} 文字列処理
{readr} 入出力処理
{forcats} ファクター処理
{purrr} 繰り返し処理
{lubridate} 時間処理
NA処理
総合演習
What You Will Learn!
- データ分析プロジェクトにおける前処理の重要性
- Pythonと比較したときのRのメリット
- 前処理におけるRの基礎
- tidyverseによる前処理の具体的な方法
Who Should Attend!
- データサイエンスやAIに興味がある方
- ExcelやPythonのNumpy,Pandasで前処理に挫折した方
- baseRでの前処理に限界を感じた方
- tidyverseは知ってるけど,使い方がよくわからない方
- 少しでも前処理を楽にしたい方