AIエンジニアが教えるPythonによるデータの前処理

データ分析プロジェクトの最重要タスクであるデータの前処理の効率的なやり方を現役AIエンジニアの立場からわかりやすく説明します.

Ratings: 4.62 / 5.00




Description

※当コースは,前作「AIエンジニアが教えるRとtidyverseによるデータの前処理講座」の内容をPythonでアレンジしたものになります.

本コースは,データの前処理に特化しています.

近年はDXやAIが話題になっており,実に様々な方々が興味を持っている分野だと思います.

DXやAIによる成果に焦点が当たる場合が多いですが,その成果が出る前には必ずデータの前処理をする必要があります.

データの前処理は,データの読み込み,加工,結合,可視化など実に様々な工程を何回も繰り返すことで,徐々に完成に近づいていきます.

そのことが原因で,データの前処理には多大な時間(データ分析プロジェクト全体の70%~80%程度)が費やされるのです.

そんな多大な時間が費やされるデータの前処理ですが,後工程の成果物につながる重要な工程ですので,できるだけ速く正確に実施する必要があります.

データの前処理は,データサイエンスのメインプログラミング言語であるPythonかRで実施されることが多いです.

当コースでは,Pythonに焦点を当てて,データの前処理を実施するうえで,必要不可欠なパッケージであるnumpy,pandas,plotnineについて詳細に説明します.

またデータの前処理だけでなく,環境構築やPythonの基礎についても丁寧に説明しますので,今までプログラミングをしたことがない初心者でも全く問題ないです.

講師が基礎から丁寧に解説しますので,気楽に一歩一歩着実に学習し,前処理マスターを目指しましょう!!


★本コースの目的★

データの前処理のほぼすべて(80%程度)に対応すること


★本コースの特徴★

  1. とにかく現場主義!!

  2. コーディングはリアルタイム形式!!

  3. コードだけでなく,イメージも!!


★本コースの内容★

  1. コース紹介

    • 概要

    • 当コース受講における注意

    • 全体像

  2. 環境構築

    • Google Colaboratoryを利用するための準備

    • Google Colaboratoryの基本的な使い方

    • 当コースの受講方法

  3. Python

    • データ型

    • リスト

    • 辞書

    • 条件分岐処理

    • 繰り返し処理

    • 関数

    • クラス

  4. パッケージ

    1. numpy

      • ベクトルの四則演算

      • ベクトルのブロードキャスト

      • ベクトルの要素抽出

      • ベクトルの便利関数

      • 規則的なベクトルの作成

      • 論理値ベクトルの作成

      • 論理値ベクトルの計算

    2. pandas

      • データの入出力

      • メソッドチェーン

      • データフレーム処理

      • 文字列処理

      • 繰り返し処理

      • 欠損値処理

    3. plotnine

      • ヒストグラム

      • 棒グラフ

      • 散布図

  5. 総合演習



What You Will Learn!

  • データ分析プロジェクトにおける前処理の重要性
  • Pythonの基礎
  • データサイエンスにおける重要パッケージ(numpy, pandas, plotnine)の使い方
  • データの前処理の具体的な方法

Who Should Attend!

  • データサイエンスやAIに興味がある方
  • Pythonを勉強したい方
  • numpyやpandasの使い方を学習したい方
  • データの前処理を効率的にしたい方