PythonによるWebスクレイピング〜入門編〜【業務効率化への第一歩】
Seleniumを用いて、自動ログイン、テキストの抽出、画像データの収集を行ってみよう。データの収集方法を学ぶことで、定期的なデータ収集を効率良く行うことができます。
Description
受講生8,000人を超えるキカガク講師によるPythonによるWebスクレイピング入門が登場。
PythonによるWebスクレイピングの実装方法を学び、定期的なデータの収集を効率化しましょう。
Webスクレイピングとは、定期的な情報収集、大量の情報収集であれば、数行のコードを書くだけで自動で行ってくれる便利テクニックです。
このWebスクレイピング技術を用いることで、業務の効率化への第一歩を踏み出していきましょう。
【コース概要】
以下、本コースで扱う大枠の内容となっております。
Webページに自動でログイン
テキストデータを取得
ランキング形式のサイトから一括で情報を取得
画像データを取得
まとめた情報をCSVファイルに出力
検索サイトのクエリを把握
本講座では、講師自作のWebページを用いてWebスクレイピングを行います。
画像処理ライブラリであるPillowやスクレイピング・クローリングライブラリであるSeleniumの導入についても解説します。
【注意】
本講座はWebスクレイピング初学者向けであり、Webスクレイピングの基礎をしっかりと身につけていただきたいので高度な内容は抑えております。
しっかりとカリキュラムをご覧になった上でご受講ください。
HTML, CSSの基礎的な知識がある前提で講座を進めております。
理解できていない方はprogateで勉強してから受講してください。
Pythonの基本的な文法、Jupyter Notebookの使い方がわかる前提で講座を進めております。
理解できていない方は以下2つの動画(Udemy)で勉強してから受講してください。
【キカガク流】人工知能・機械学習 脱ブラックボックス講座 - 初級編 -
【キカガク流】プログラミング力向上のためのPythonで学ぶアルゴリズム論(前編)
What You Will Learn!
- seleniumを用いてテキスト情報を抽出することができるようになります。
- seleniumを用いて自動でログインすることができるようになります。
- Webページからテキスト情報を取得することができるようになります。
- Pillowを用いてPythonで画像を扱うことができるようになります。
- ランキング形式のサイトからまとめて情報を収集することができるようになります。
- Pandasを用いてデータを整理し、CSVへの掃き出しをできるようになります。
Who Should Attend!
- 自動でWebから情報を取得するのに興味がある方
- 機械学習等で使用するデータをWebから取得したい方
- 業務効率化のためにWebスクレイピングを学びたい方