AIエンジニアが教えるPythonによるデータの前処理
データ分析プロジェクトの最重要タスクであるデータの前処理の効率的なやり方を現役AIエンジニアの立場からわかりやすく説明します.
Description
※当コースは,前作「AIエンジニアが教えるRとtidyverseによるデータの前処理講座」の内容をPythonでアレンジしたものになります.
本コースは,データの前処理に特化しています.
近年はDXやAIが話題になっており,実に様々な方々が興味を持っている分野だと思います.
DXやAIによる成果に焦点が当たる場合が多いですが,その成果が出る前には必ずデータの前処理をする必要があります.
データの前処理は,データの読み込み,加工,結合,可視化など実に様々な工程を何回も繰り返すことで,徐々に完成に近づいていきます.
そのことが原因で,データの前処理には多大な時間(データ分析プロジェクト全体の70%~80%程度)が費やされるのです.
そんな多大な時間が費やされるデータの前処理ですが,後工程の成果物につながる重要な工程ですので,できるだけ速く正確に実施する必要があります.
データの前処理は,データサイエンスのメインプログラミング言語であるPythonかRで実施されることが多いです.
当コースでは,Pythonに焦点を当てて,データの前処理を実施するうえで,必要不可欠なパッケージであるnumpy,pandas,plotnineについて詳細に説明します.
またデータの前処理だけでなく,環境構築やPythonの基礎についても丁寧に説明しますので,今までプログラミングをしたことがない初心者でも全く問題ないです.
講師が基礎から丁寧に解説しますので,気楽に一歩一歩着実に学習し,前処理マスターを目指しましょう!!
★本コースの目的★
データの前処理のほぼすべて(80%程度)に対応すること
★本コースの特徴★
とにかく現場主義!!
コーディングはリアルタイム形式!!
コードだけでなく,イメージも!!
★本コースの内容★
コース紹介
概要
当コース受講における注意
全体像
環境構築
Google Colaboratoryを利用するための準備
Google Colaboratoryの基本的な使い方
当コースの受講方法
Python
データ型
リスト
辞書
条件分岐処理
繰り返し処理
関数
クラス
パッケージ
numpy
ベクトルの四則演算
ベクトルのブロードキャスト
ベクトルの要素抽出
ベクトルの便利関数
規則的なベクトルの作成
論理値ベクトルの作成
論理値ベクトルの計算
pandas
データの入出力
メソッドチェーン
データフレーム処理
文字列処理
繰り返し処理
欠損値処理
plotnine
ヒストグラム
棒グラフ
散布図
総合演習
What You Will Learn!
- データ分析プロジェクトにおける前処理の重要性
- Pythonの基礎
- データサイエンスにおける重要パッケージ(numpy, pandas, plotnine)の使い方
- データの前処理の具体的な方法
Who Should Attend!
- データサイエンスやAIに興味がある方
- Pythonを勉強したい方
- numpyやpandasの使い方を学習したい方
- データの前処理を効率的にしたい方