【データサイエンス入門】Pythonとpolarsによるデータの前処理

日本初のpolars解説コース!DXやAIに必要不可欠なデータの前処理を最先端パッケージのpolarsで実施します!pandasに取って代わる可能性があるpolarsの使い方をマスターしてデータの前処理をサクサクッとやりましょう!!

Ratings: 4.16 / 5.00




Description

※当コースは,前作「AIエンジニアが教えるPythonによるデータの前処理」の内容をpolarsでアレンジしたものになります.(numpyとplotnineは当コースの対象外です。)

当コースは,データの前処理に特化しています.

近年はDXやAIが話題になっており,実に様々な方々が興味を持っている分野だと思います.

DXやAIによる成果に焦点が当たる場合が多いですが,その成果が出る前には必ずデータの前処理をする必要があります.

データの前処理は,データの読み込み,加工,結合,可視化など実に様々な工程を何回も繰り返すことで,徐々に完成に近づいていきます.

そのことが原因で,データの前処理には多大な時間(データ分析プロジェクト全体の70%~80%程度)が費やされるのです.

そんな多大な時間が費やされるデータの前処理ですが,後工程の成果物につながる重要な工程ですので,できるだけ速く正確に実施する必要があります.

データの前処理は,今まではPythonのpandasというパッケージがデファクトスタンダードでした。

ところがpandasは、コーディングが難しく、扱うのが難しいという欠点があります。

そのようなpandasに取って代わる可能性があるのがpolarsというパッケージです!

polarsはpandasと比較し、以下のようなメリットがあります。

  • インデックスがない!

  • 書きやすい!

  • 高速!

polarsを利用すれば今まで時間がかかっていたデータの前処理をサクサクッと実施することができます。

当コースでは,そんな最先端のパッケージであるpolarsについて詳細に説明します.

またpolarsだけでなく,環境構築やPythonの基礎についても丁寧に説明しますので,今までプログラミングをしたことがない初心者でも全く問題ないです.

講師が基礎から丁寧に解説しますので,気楽に一歩一歩着実に学習し,前処理マスターを目指しましょう!!


◆本コースの目的◆

データの前処理のほぼすべて(80%程度)に対応すること


◆本コースの特徴◆

  1. とにかく現場主義!!

  2. コーディングはリアルタイム形式!!

  3. コードだけでなく,イメージも!!


◆本コースの内容◆

  1. コース紹介

    • 概要

    • 当コース受講における注意

    • 全体像

  2. 環境構築

    • Google Colaboratoryを利用するための準備

    • Google Colaboratoryの基本的な使い方

    • 当コースの受講方法

  3. Python

    • データ型

    • リスト

    • 辞書

    • 条件分岐処理

    • 繰り返し処理

    • 関数

    • クラス

  4. パッケージ

    1. polars

      • データの入出力

      • メソッドチェーン

      • データフレーム処理

      • 文字列処理

      • 繰り返し処理

      • 欠損値処理

  5. 総合演習

What You Will Learn!

  • データ分析プロジェクトにおける前処理の重要性
  • Pythonの基礎
  • polarsの使い方
  • データの前処理の具体的な方法

Who Should Attend!

  • DXやAIに興味がある方
  • Pythonによるデータの前処理を勉強したい方
  • pandasを学習したが、polarsに乗り換えたい方
  • データの前処理を効率的にしたい方