Text Mining no R: extração, informação, análise, documento
Aprenda a transformar o texto em dados para análise, por meio da aplicação do processamento de linguagem natural (PLN)
Description
Os dados não estruturados representam mais de 80% de tudo que circula na internet. A disponibilização de dados nesta nova forma de armazenamento é cada dia mais crescente em todas as organizações mundiais. Um grande desafio é entender o que textos, sites, arquivos em formatos word, pdf, etc podem nos trazer de informações relevantes e qual seria esta amplitude.
Pensando nisso, foi criado o curso Text Mining no R: extração, informação, análise, documento que visa entender o processo de obtenção de informações importantes de um texto com base na recuperação de informações, extração de dados, aprendizado de máquina, estatísticas e linguística computacional que são tarefas típicas de mineração de texto, que incluem categorização e agrupamento de texto, extração de conceito/entidade, produção de taxonomias granulares, análise de sentimentos.
O curso é trabalhado com diversos práticas em arquivos texto, inclusive com o uso de web scrapping, ou seja, coleta de dados web ou raspagem web, é uma forma de mineração que permite a extração de dados de sites da web convertendo-os em informação estruturada para posterior análise.
Para isso você conta:
· Acesso total vitalício ao conteúdo do curso;
· Certificado de conclusão do curso oferecido pela Udemy;
· Acesso no seu dispositivo móvel e TV ou Computador;
· Acesso 24h / 7 dias por semana aos instrutores usando a seção de Perguntas e Respostas.
SEJA MAIS UM ALUNO DESTE CLUBE QUE NÃO PARA CRESCER!
What You Will Learn!
- Processo de obtenção de informações importantes de um texto
- Recuperação de informações, extração de dados, aprendizado de máquina, estatísticas e linguística computacional
- Agrupamento de texto, extração de conceito/entidade, produção de taxonomias granulares, análise de sentimentos
- Nuvem de Palavras
- Corpus
- Tokenização
- Tokens
- Frequência de Palavras
- Stopwords
- Processo de Text Mining
- Utilização de pacotes: BiocManager, rvest, stringr,lexiconPT,widyr, ggraph, igraph, tibble
- Utilização de pacotes: TM, tidyr, ggplot2, SnowballC, dplyr, tidytext, wordcloud, RColorBrewer
- Ajustes e transformação nos textos: radicais, eliminação de espaços em branco, palavras indesejadas
- Criação de Matriz Termo Documento
- Correlação entre textos, palavras mais ditas, associação entre palavras
- Análise de Sentimento
- Web scraping
- Comandos: VCorpus, inspect, meta, lapply, tm_map, stopwords, documentTermMatrix, findFreqTerms
- Comandos: FindAssocs, bind_tf_idf, count, arrange, filter, geom_col, unnest_tokens, anti_join, pairwise_cor
- Comandos: Inner_join, group_by, summarize, mutate, barchart, str_c, str_detect, str_subset, str_which, str_count, str_replace_all
- Comandos: Tolower, removePunctuation, removeNumbers, stripWhitespace, stemDocument
- Estudo de Ngrams, em especial Bigrams
Who Should Attend!
- Estudantes de BI, Estatística, Computação, Informática, Gestores de Empresas (RH, Administração, Economia, dentre outros)
- Pessoas interessadas em aprender os conceitos mais aprofundados sobre técnicas de Text Mining para estudo de textos diversos