Mineração e Análise de Dados do LinkedIn
Utilize técnicas de Ciência de Dados e Inteligência Artificial para extrair e analisar sua rede de contatos do LinkedIn
Description
O LinkedIn é uma rede social altamente voltada para a experiência profissional com o intuito de gerar conexões e relacionamentos entre profissionais de diversas áreas. Os profissionais podem criar currículos e buscar empregos por meio da conexão com pessoas do mundo inteiro. Por exemplo, se você gostaria de trabalhar na área de Ciência de Dados, pode formar conexões com empresas e pessoas que trabalham nessa área, aumentando as chances de conseguir uma vaga. Por outro lado, as empresas conseguem buscar os candidatos ideais para suas vagas, de acordo com o currículo e habilidades fornecidas pelos usuários. Em 2017, o LinkedIn firmou-se como a maior plataforma de negócios e importante ferramenta estratégica tanto para profissionais quanto para empresas.
Dentro deste contexto, é importante que os profissionais saibam como utilizar os dados dessa rede sociais a seu favor. Para isso, o próprio LinkedIn disponibiliza uma série de bases de dados relacionadas ao seu perfil, nas quais é possível aplicar técnicas de Ciência e Análise de Dados para extrair insights importantes e interessantes sobre a nossa rede de conexões. Dessa forma, podemos responder perguntas como: Quais são os cargos principais das pessoas que estão conectadas a nós? Quais são as empresas que estão enviando convites para nosso perfil? Qual é a localização principal de nossos contatos? Nossa rede do LinkedIn é composta por pessoas e empresas relacionadas ao nosso trabalho? As empresas que quero trabalhar estão enviando convites para meu perfil? Essas e outras perguntas serão respondidas durante este curso, e com isso, você pode analisar se sua rede está de acordo com o que você almeja profissionalmente. Abaixo você pode observar os principais tópicos que serão implementados passo a passo:
Extrair dados do seu perfil do LinkedIn, utilizando a API do LinkedIn e arquivos .csv. Caso você não tenha LinkedIn poderá acompanhar normalmente o curso, pois serão disponibilizadas as bases de dados do meu perfil
Extrair e analisar informações como: conexões entre os usuários, convites enviados/recebidos e mensagens
Gerar nomes de usuários falsos para mascarar as informações reais
Explorar e visualizar dados relativos às empresas e cargos de seus contatos (geração de gráficos dinâmicos)
Utilizar a distância de edição (Levenshtein), similaridade n-grama e distância de Jaccard para medir a similaridade entre os cargos
Agrupar os contatos baseado na similaridade entre os cargos, bem como gerar visualizações em HTML para melhorar a apresentação dos dados
Utilizar APIs de localização para extrair a latitude e longitude dos contatos, com o intuito de capturar a cidade e país de cada um
Visualizar a localização dos contatos dinamicamente com o Google Earth e a biblioteca Basemap
Agrupar os contatos utilizando o algoritmo k-means da área de aprendizagem de máquina (machine learning)
Aplicar técnicas de processamento de linguagem natural para analisar suas mensagens no LinkedIn
Gerar nuvem de palavras com os termos mais frequentes das mensagens, bem como extrair entidades nomeadas
Criar um classificador de sentimentos para extrair a polaridade das mensagens do LinkedIn
Durante o curso, vamos utilizar a linguagem de programação Python e também o Google Colab, ou seja, não é necessário gastar tempo instalando ou configurando ferramentas. Você conseguirá acompanhar o curso tendo um navegador simples e uma conexão com a Internet! Este é o curso ideal caso seja seu primeiro contato com análise de dados de redes sociais!
What You Will Learn!
- Extrair dados do seu perfil do LinkedIn, utilizando a API do LinkedIn e arquivos .csv
- Extrair e analisar informações como: conexões entre os usuários, convites enviados/recebidos e mensagens
- Gerar nomes de usuários falsos para mascarar as informações reais
- Explorar e visualizar dados relativos às empresas e cargos de seus contatos
- Utilizar a distância de edição (Levenshtein), similaridade n-grama e distância de Jaccard para medir a similaridade entre os cargos
- Agrupar os contatos baseado na similaridade entre os cargos, bem como gerar visualizações em HTML para melhorar a apresentação dos dados
- Utilizar APIs de localização para extrair a latitude e longitude dos contatos, com o intuito de capturar a cidade e país de cada um
- Visualizar a localização dos contatos dinamicamente com o Google Earth e a biblioteca Basemap
- Agrupar os contatos utilizando o algoritmo k-means da área de aprendizagem de máquina (machine learning)
- Aplicar técnicas de processamento de linguagem natural para analisar suas mensagens no LinkedIn
- Gerar nuvem de palavras com os termos mais frequentes das mensagens, bem como extrair entidades nomeadas
- Criar um classificador de sentimentos para extrair a polaridade das mensagens do LinkedIn
Who Should Attend!
- Qualquer pessoa interessada em análise de dados utilizando dados de redes sociais
- Pessoas interessadas na aplicação de técnicas de Inteligência Artificial e Ciência de Dados em dados extraídos de redes sociais
- Pessoas interessadas em extração de dados de redes sociais
- Alunos de graduação que estão estudando disciplinas ligadas a área de Inteligência Artificial, Ciência de Dados ou Análise de Dados