Curso maestro de Web Scraping: Extracción de Datos de la Web

Web Scraping en Python | Extracción de 20 sitios web | 7 librerías | Programación desde CERO | ¡TODO EN UN SOLO CURSO!

Ratings: 4.64 / 5.00




Description

Si buscabas convertirte en un experto en la extracción de datos de la web estás en el curso correcto. Estás viendo el curso más completo sobre Web Scraping de toda la Internet.

Te enseñaré desde CERO los fundamentos del Web Scraping de una manera muy sencilla de entender. ¡VOY DIRECTO AL GRANO! Realizaremos extracción de datos de más de 20 páginas web (FACEBOOK, YOUTUBE, HACKERNEWS, AIRBNB, OLX, MERCADO LIBRE, GOOGLE REVIEWS, ACCUWEATHER, TRIP ADVISOR, entre otras), sin detenernos en explicaciones complejas que no te servirán de mucho. En muy poco tiempo vas a aprender Web Scraping y te vas a enamorar del mundo de la extracción de datos!   


En este curso utilizaremos Python. El mejor lenguaje de programación para principiantes y uno de los favoritos a la hora de hacer Web Scraping.   

  • Si no sabes programar, te explicaré los fundamentos de la programación de una manera rápida y muy sencilla en la primera sección del curso.

  • Aprenderemos a hacer Web Scraping de:

    • Una página (NIVEL 1)

    • Varias páginas al mismo tiempo (NIVEL 2)

    • Páginas con carga dinámica (NIVEL 3)

    • APIs, iframes y scripts (NIVEL 4)

    • Páginas con CAPTCHAs, protección de Cloudflare, Token CSRF y autenticación por LOGIN (NIVEL 5)

    • y Web Scraping utilizando Proxies.

  • Finalmente existe un NIVEL EXTRA que contiene lo siguiente: 

    • Extracción de imágenes y archivos

    • Automatización de extracciones

    • Almacenamiento de datos en base de datos (MongoDB)

    • Actualizaciones periódicas de los datos almacenados.

  • Practicaremos extrayendo datos de más de 20 sitios web: YOUTUBE, FACEBOOK, X (TWITTER), HACKERNEWS, OLX, AIRBNB, MERCADO LIBRE, DIARIO EL UNIVERSO, WIKIPEDIA, STACKOVERFLOW, W3SCHOOLS, TRIPADVISOR, GOOGLE REVIEWS, GOOGLE SCHOLAR, GITHUB, ACCUWEATHER, URBANIA, ZONAPROP, FOOTDISTRICT, IGN, entre otros.

  • Vamos a aprender a utilizar 7 librerías modernas para hacer Web Scraping: LXML, Requests, Scrapy, Selenium, Beautiful Soup, Requests-HTML y Cloudscraper. Cada una con sus PROS y sus CONS. De tal forma que tengas un arsenal de herramientas para elegir al momento de hacer tu siguiente extracción de datos. Además veremos otras librerías tales como: Pillow, schedule, time, json y pymongo.

  • No nos detendremos en detalles complejos ni en teorías avanzadas. ¡Solamente veremos lo realmente necesario para que te conviertas en un maestro del Web Scraping!

  • Este curso utiliza la PRÁCTICA como herramienta principal para aprender. Es por esto que extraemos datos de +20 sitios web que suman un total de casi 19 horas de pura práctica extrayendo datos.

  • Soporte para instalación de librerías, preguntas sobre el curso, y extracciones personalizadas con las que tengas problemas.

  • ¡El curso es actualizado constantemente! ¡Este 2024 ya tenemos 8 clases nuevas! 


Este curso es tu mejor opción si:

  • Quieres convertirte en un maestro del Web Scraping de la forma más sencilla posible.

  • Quieres aprender Web Scraping practicando con muchos ejemplos de páginas reales.

  • Has tenido dificultades con otros cursos, y has llegado a pensar que la programación no es lo tuyo.

  • Eres un profesional en otra área diferente a la informática (estadística, matemática, biologia, ingenierías, etc) que necesita aprender a extraer datos de la web ¡YA!

  • Quieres aprender Web Scraping sin detenerte en explicaciones largas y complejas.

  • Quieres aprender desde los fundamentos hasta la limpieza, almacenamiento y actualización de los datos que extraigas.

What You Will Learn!

  • Aprenderás a extraer datos de la web utilizando Python.
  • Te enseñaré desde los fundamentos del Web Scraping hasta la limpieza, almacenamiento (MongoDB) y actualización de los datos que extraigamos.
  • Practicaremos extrayendo datos de más de 20 páginas web reales (FACEBOOK, YOUTUBE, TWITTER, MERCADO LIBRE, OLX, GOOGLE PLACES, TRIP ADVISOR, IGN, entre otros)
  • Extraerás datos de páginas webs que cargan dinámicamente, webs con paginación, webs con captchas y webs con autenticación.
  • Aprenderás a automatizar tus extracciones para que se ejecuten de manera periódica y realicen actualizaciones incrementales de los datos descargados.
  • Si no sabes programar, ¡Te enseñare a programar desde CERO para que no tengas problemas en el curso!
  • Aprenderás a extraer y procesar datos de la Web utilizando 7 librerías diferentes (Requests, lxml, Scrapy, BeautifulSoup, Selenium y más).
  • Entenderás cómo funcionan las estructuras y protocolos de las páginas webs y los formatos de transmisión de información (XML y JSON).
  • Aprenderás a sobrepasar la barrera de los molestos CAPTCHAs al hacer extracción de datos.
  • Aprenderás a hacer web scraping de manera ética y segura. Protegiendo tus IPs y evitando los baneos.
  • Aprenderás a realizar Web Scraping en la nube con Proxies.
  • Aprenderás a realizar extracción de imágenes y archivos

Who Should Attend!

  • Personas que quieran convertirse en maestros del Web Scraping con un solo curso.
  • Cualquier persona que quiera aprender Web Scraping de una manera sencilla.
  • Personas que quieren aprender a extraer datos de la web pero NO saben programar.
  • Personas que necesitan extraer datos de la web para un proyecto, investigación o tesis.
  • Investigadores o científicos de datos que necesitan extraer datos de la web para ser analizados.
  • Personas que les gusta aprender a través de la práctica.