Text Mining no R: extração, informação, análise, documento

Aprenda a transformar o texto em dados para análise, por meio da aplicação do processamento de linguagem natural (PLN)

Ratings: 4.83 / 5.00




Description

Os dados não estruturados representam mais de 80% de tudo que circula na internet. A disponibilização de dados nesta nova forma de armazenamento é cada dia mais crescente em todas as organizações mundiais. Um grande desafio é entender o que textos, sites, arquivos em formatos word, pdf, etc podem nos trazer de informações relevantes e qual seria esta amplitude.

Pensando nisso, foi criado o curso Text Mining no R: extração, informação, análise, documento que visa entender o processo de obtenção de informações importantes de um texto com base na recuperação de informações, extração de dados, aprendizado de máquina, estatísticas e linguística computacional que são tarefas típicas de mineração de texto, que incluem categorização e agrupamento de texto, extração de conceito/entidade, produção de taxonomias granulares, análise de sentimentos.

O curso é trabalhado com diversos práticas em arquivos texto, inclusive com o uso de web scrapping, ou seja, coleta de dados web ou raspagem web, é uma forma de mineração que permite a extração de dados de sites da web convertendo-os em informação estruturada para posterior análise.

Para isso você conta:

· Acesso total vitalício ao conteúdo do curso;

· Certificado de conclusão do curso oferecido pela Udemy;

· Acesso no seu dispositivo móvel e TV ou Computador;

· Acesso 24h / 7 dias por semana aos instrutores usando a seção de Perguntas e Respostas.


SEJA MAIS UM ALUNO DESTE CLUBE QUE NÃO PARA CRESCER!


What You Will Learn!

  • Processo de obtenção de informações importantes de um texto
  • Recuperação de informações, extração de dados, aprendizado de máquina, estatísticas e linguística computacional
  • Agrupamento de texto, extração de conceito/entidade, produção de taxonomias granulares, análise de sentimentos
  • Nuvem de Palavras
  • Corpus
  • Tokenização
  • Tokens
  • Frequência de Palavras
  • Stopwords
  • Processo de Text Mining
  • Utilização de pacotes: BiocManager, rvest, stringr,lexiconPT,widyr, ggraph, igraph, tibble
  • Utilização de pacotes: TM, tidyr, ggplot2, SnowballC, dplyr, tidytext, wordcloud, RColorBrewer
  • Ajustes e transformação nos textos: radicais, eliminação de espaços em branco, palavras indesejadas
  • Criação de Matriz Termo Documento
  • Correlação entre textos, palavras mais ditas, associação entre palavras
  • Análise de Sentimento
  • Web scraping
  • Comandos: VCorpus, inspect, meta, lapply, tm_map, stopwords, documentTermMatrix, findFreqTerms
  • Comandos: FindAssocs, bind_tf_idf, count, arrange, filter, geom_col, unnest_tokens, anti_join, pairwise_cor
  • Comandos: Inner_join, group_by, summarize, mutate, barchart, str_c, str_detect, str_subset, str_which, str_count, str_replace_all
  • Comandos: Tolower, removePunctuation, removeNumbers, stripWhitespace, stemDocument
  • Estudo de Ngrams, em especial Bigrams

Who Should Attend!

  • Estudantes de BI, Estatística, Computação, Informática, Gestores de Empresas (RH, Administração, Economia, dentre outros)
  • Pessoas interessadas em aprender os conceitos mais aprofundados sobre técnicas de Text Mining para estudo de textos diversos