Machine Learning para Competições Kaggle - Curso 2

Aprenda passo a passo como trabalhar com bases de dados de agrupamento e associação voltados a desafios reais no Python

Ratings: 4.86 / 5.00




Description

As competições de Ciência de Dados como aquelas postadas na plataforma Kaggle são uma ótima maneira de testar as habilidades adquiridas em cursos iniciais, e ainda aprender novas habilidades necessárias para resolver problemas reais. Entretanto, fazer essa transição entre um ambiente educacional e aquele que encontramos no Kaggle, que imita os desafios que devemos encontrar no mercado de trabalho, tende a ser um degrau muito grande, pois a natureza dos dados e dos problemas propostos aumenta de complexidade num nível que os cursos básicos não contemplam.

Pensando nisso, este curso tem o objetivo de preencher essa lacuna na formação dos cientistas de dados, mostrando detalhadamente como abordar os desafios, passando pelas fases de exploração e tratamento de dados, escolha de abordagem de solução, construção de um modelo, treinamento e validação. O entendimento desse processo é o primeiro passo para que os competidores possam desenvolver melhorias e começar sua escalada rumo ao topo dos rankings.

Neste curso focaremos em duas das principais tarefas da aprendizagem de máquina não supervisionada: agrupamento e associação

  1. Com relação ao agrupamento, vamos trabalhar com uma base de dados do jogo FIFA Soccer 2019 e usar as características técnicas de cada jogador, juntamente com a altura e peso para agrupá-los em um perfil técnico. Investigaremos as relações entre estes perfis e as posições originais dos jogadores utilizando o algoritmo k-means e a biblioteca sklearn

  2. No que se refere a associação, vamos explorar o extenso conjunto de dados Instacart Market Basket Analysis com mais de 3 milhões de transações de supermercado, compreendendo uma enorme variedade de produtos de diferentes departamentos. Faremos a geração de regras de associação com base em duas coleções de dados: hábitos de compra (dia e hora, intervalo entre pedidos) e associação de produtos (quais produtos tendem a ser vendidos juntos). Usaremos duas abordagens: na primeira vamos usar a biblioteca apyori para geração das regras, enquanto que na segunda faremos a implementação do zero do algoritmo apriori!

Vamos desenvolver todos os códigos utilizando a linguagem Python linha por linha com o Google Colab, de forma que você entenda todas as análises necessárias para participar dessas competições!

What You Will Learn!

  • Como trabalhar com bases de dados reais de agrupamento e associação, aplicado em competições reais do Kaggle
  • Desenvolva insights que permitam construir modelos de Machine Learning aplicados em problemas reais
  • Crie vários tipos de gráficos para ajudar na compreensão e análise dos dados
  • Use as características técnicas de cada jogador do FIFA 2019 para agrupá-los em um perfil técnico
  • Investigue as relações entre os perfis dos jogados do FIFA 2019 com suas posições originais
  • Utilize regras de associação para encontrar padrões em hábitos de compra dos clientes
  • Utilize regras de associação para análise de cestas de compras (market basket analysis)

Who Should Attend!

  • Pessoas que já estejam num nível intermediário de sua formação em Ciência de Dados, e que agora estejam procurando aprender a usar suas habilidades em desafios reais
  • Analistas de dados que queiram aumentar seu conhecimento na área de Machine Learning
  • Alunos de graduação que estão estudando disciplinas ligadas a área de Inteligência Artificial
  • Qualquer pessoa interessada em Inteligência Artificial