Machine Learning com Spark e Pyspark: o Curso Completo

Domine a Criação e Tunning de Modelos de Machine Learning Utilizando Spark e Python!

Ratings: 4.38 / 5.00




Description

Faça uma super imersão em Machine Learning com Spark utilizando bibliotecas nativas!

Na era "Big Data" o Spark se tornou a principal ferramenta de processamento de dados no mundo devido a sua capacidade de processar volumes massivos de dados com alta performance, se tornando uma ferramenta essencial para Cientistas e Engenheiros de Dados. Sua arquitetura distribuída permite processar dados utilizando paralelismo e memória, persistindo dados quando necessário. Além disso o Spark é capaz de importar dados de praticamente qualquer fonte, bem como também exportar dados processados para os principais formatos e bancos de dados utilizados.

Do ponto de vista profissional, conhecer Spark é uma das habilidades mais importantes ao lado de Machine Learning e Python. E o melhor disso é o que Spark já traz tudo isso. Você pode utilizar Spark com Python, através do Pyspark, e você pode criar modelos de Machine Learning utilizando as próprias bibliotecas do Spark.

Neste curso prático, você vai dominar o uso do Spark para Machine Learning:

  • Aprenda os conceitos gerais de Machine Learning

  • Conheça o Processo de Importação de Dados

  • Domine técnicas de pré-processamento, como substituição de valores faltantes

  • Aprenda técnicas de engenharia de atributos, como normalização de dados e codificação de categorias

  • Crie modelos de Regressão e Classificação, utilizando Redes Neurais, Random Forest e outras

  • Avalie a performance de seus modelos

  • Crie Clusters e avalia a performance

  • Produza regras de associação com itens frequentes

  • Faça o tunning de Hiper Parâmetros de Modelos

  • Cria fluxos de processamento de Machine Learning utilizando Pipelines

  • e muito mais!

Você ainda vai encontrar material do curso para baixar: scripts, slides e dados de exemplo.

What You Will Learn!

  • Aprenda Otimização de Hiper Parâmetros de Modelos
  • Saiba Criar Pipelines de Machine Learning
  • Domine Técnicas de Pré-Processamento de dados
  • Veja na Prática a Criação de Modelos de Regressão, Classificação e Clusters
  • Produza Assobiadores Robustos
  • Avalie a Performance de Modelos
  • Importe Dados
  • Persista Modelos
  • Utilize Técnicas como MultiLayer Perceptron, Random Forest e Regressão Logística

Who Should Attend!

  • Cientistas de Dados
  • Engenheiros de Dados
  • Engenheiros de Machine Learning
  • Analistas de Dados