データサイエンスのための実践Pandas
プロレベルのデータ分析スキルを習得しよう
Description
【Pandasを学ぶメリット】
PandasはPythonでデータ分析を行う上で最も重要なライブラリの1つです。
PandasはDataFrameをコアとしてデータの前処理/集計/可視化など分析に必要な非常に多くの機能を持ち合わせています。
この為、Pandasのスキルはデータ分析のスキルに直結します。
一方で、できることが多い分、使いこなすためには知っておくべき知識やTipsが数多くあります。
【人事の方/マネージャークラスの方へ】
本コースは次のような使い方が可能です。
・DX推進チームを立ち上げたが、チーム全体のデータ分析スキルを底上げしたい
・データは溜まりつつあるが、実用レベルのデータ分析をこなせるデータサイエンティストを育成する必要がある
本コースを修了すると、社内で蓄積しているデータを適切に集計・可視化しプロレベルの分析スキルを持つ人材を育成できます。
【本コースの目的】
そこで、本コースは敢えて、Pandasと可視化のみにトピックを絞り、この2つを集中的に解説していきます。
やることを絞っているため、短時間で効率よく、データ分析に必要なスキルのエッセンスを身に付けることが本コースの目的です。
また、最後に学んだことを実務に活かせるレベルに落とし込むために探索的データ分析による演習があります。
【対象者とゴール】
本コースではPandasと可視化のトピックに特化しており、レベルとしても中級レベルにあたります。
この為、Pythonの基本的な文法には十分に習熟しておく必要があります。
本コースを修了すると、Pythonにおけるデータ分析のスキルとしては実用レベルのスキルが習得できます。
特にコースの中では実際のデータ分析の状況で使用するようなコードやTipsを紹介していきますので、実務にすぐに応用可能です。
ゴールイメージとしては、"Pandasを使える人"から"Pandasを使いこなせる人"へNext Levelにレベルアップ可能です。
【コースの概要】
詳細は本コースの概要説明をご覧ください。
本コースは大きく
・Pandas基礎/応用
・可視化
・探索的データ分析
の3つのパートに分かれています。
Pandas基礎/応用では
PandasにおけるDataFrameとは何かという基本的なところから出発し、
・データの選択/抽出
・データの生成 / 消去 / 演算
・データの前処理(データ型 / Null値の処理 / / 重複データの処理)
・データの集計(Group by / pivot_table / meltなど)
・テーブルの結合
などPandasに関する項目を体系的に解説します。
可視化についてはデータ分析の実務上最もよく使うと想定される
matplotlib, seaborn, plotlyについて解説を行います。実際に使う可能性の高い可視化を優先的に解説しています。
探索的データ分析ではここまでに学習した内容を活きたデータ分析にする為、
実際のログデータを用いた探索的データ分析を行います。
ここでは実データの前処理、集計、可視化など実務で必要となるデータ分析の流れを体験する事ができ、プロレベルのデータ分析スキルを習得する事が出来ます。また、データを多面的に見る過程で多くの洞察を得ますので、分析内容を追うだけでも楽しめる内容となっております。
【コースの特徴】
本コースには以下のような特徴があります。
・ハンズオン
コースはハンズオンであり、講師が受講生と一緒にスクラッチからコードを書いていきます。
この為、実際の実務と同じ流れでstep by stepでコードの実装を学習する事が出来ます。
・様々な業界の実データを取り扱う
本コースは学習する内容を実務レベルで活かせるようにするために
様々なビジネスの実データを取り扱っています。
・売り上げのトランザクションデータ
・不動産取引のログ
・サービスの使用ログ
これらデータの前処理も含めて学ぶことができるので、実際的なスキルが身に付きます。
What You Will Learn!
- データ分析において重要なPandasの体系的な理解
- matplotlib, seaborn, plotlyなどの可視化ライブラリの実践的知識
- 種々の実データに対する前処理、集計、可視化の実用的な知識
- 探索的データ分析を通じて実践レベルのデータ分析スキル
Who Should Attend!
- データサイエンスにおいて実践的なスキルを身に着けたい方
- データアナリスト・データサイエンティストを目指している方
- データ分析を担当している方で体系的にPandas・可視化スキルを学びたい方