Curso de Estatística: R para Análise de Dados.
Aprenda dos tópicos básicos aos avançados em estatística com R (R-studio): Tidyverse, GGplot2 e Muito mais!
Description
O curso apresenta os conceitos da estatística de maneira simples e objetiva, com explicação suporte à aplicação prática no software R, planejado para que o aluno consiga interpretar e calcular as principais estatísticas, testes e gráficos através de exemplos, de modo a desenvolver habilidades requisitadas no ambiente profissional de análise de dados como no ambiente acadêmico.
Deste modo, o curso conta com um módulo de estatística descritiva, aonde o aluno aprenderá as principais estatísticas básicas para descrever uma variável, através de exemplos práticos e simulações, deste modo o aluno aprenderá a: 1) classificar as variáveis segundo sua natureza; 2) entender o conceito de distribuição de frequências e de probabilidade, assim como as calcular no software R; 2) conceitos básicos de população e amostra e a diferença entre o estimador e uma estimativa, assim como propriedades dos estimadores, que serão bem vistas através de simulações; 3) medidas de tendência central como média, mediana e moda, seus estimadores e propriedades; 4) separatrizes como a mediana, quartis, decis e percentis; 5) medidas de dispersão como a variância/desvio-padrão e o intervalo inter-quartil; 6) medidas de extremidades; 7) curtose e assimetria; 8) algumas distribuições de probabilidade e como calcular probabilidade no R de uma distribuição de probabilidade ideal e de uma distribuição amostral estimada via Kernel; 9) estatísticas condicionais como a distribuição, a média, desvio padrão e etc... 10) Covariância e Correlação.
Um módulo de estatística gráfica onde o aluno ao final do curso será capaz de analisar uma variável através de seus gráficos: 1) teoria gráfica; 2) erros a serem evitados; 3) gráficos de histograma e densidade, 4) gráficos box-plot; 5) gráficos de associação como correlogramas e scatter-plot. Este módulo também capacitará o aluno a criar diversos gráficos com aplicação prática, tanto em apresentações quanto artigos científicos e/ou trabalhos de faculdade, utilizando e combinando informações qualitativas e quantitativas necessárias para criar um gráfico informativo.
Um módulo de inferência onde o aluno ao final do curso será capaz de construir hipóteses estatísticas, aplicar os testes adequados e interpreta-los: 1) Teoria inferencial estatística: introdução, motivação e discussão; 2) Hipóteses e erros de decisão, tipo I e tipo II; 3) Probabilidade dos erros: nível de significância, beta e o poder ; 4) testes de normalidade: inspeção gráfica, testes estatísticos e dois artigos científicos; 5) testes de média para uma amostra: teste Z e t; 6) testes de média para duas amostras: teste t ; 7) teste de média para mais de duas amostras ANOVA e testes post-hoc como teste de Tukey e testes t parcial; 8) testes não paramétricos como wilcoxon, mann-whitney, Kruskall-Wallis.
What You Will Learn!
- Distribuição de frequência, densidade e probabilidade acumulada
- Diferença entre população e amostra, estimador e estimativa
- Medidas de tendência central, seus estimadores e propriedades via simulação
- Medidas de dispersão, variância/desvio-padrão e o IQR: seus estimadores e propriedades
- O estimador de densidade Kernel e suas propriedades
- Separatrizes: mediana, quartis, decis e percentis
- Curtose e assimetria
- Covariância e correlação
- Distribuição e estatísticas condicionais
- Gráficos com o ggplot2
- Gráficos de distribuição: histograma, densidade
- Gráficos box-plot
- Gráficos de associação como correlogramas e scatterplot
- Teoria gráfica
- Inferência estatística: motivação, teste de hipóteses, a hipótese nula, erros de decisão, nível de significância, beta e o poder
- Testes de normalidade: Kolgomorov-Smirnov, Lilliefors, Anderson-Darling, Cramer Von Mises, Shapiro Wilker, Shapiro Francia, Jarque-Bera
- Testes de normalidade: inspeção gráfica, o gráfico da distribuição de densidade, acumulada e o qqplot
- Testes de média: uma, duas amostras, para grupos pareados e independentes, com variâncias idênticas e diferentes e com mais de dois grupos ANOVA
- Análise ANOVA: one-way, two-way, medidas repetidas, post hoc com teste de Tukey e teste t parcial com p-valor corrigido
- Testes não paramétricos: teste de mann-whitney, Kruskall-wallis e wilcoxon
Who Should Attend!
- Este curso é destinado para pessoas que querem aprender análise de dados voltado para o mercado de trabalho e também para pesquisa cientifica.
- Desenvolvedores iniciantes em R
- Alunos que aspiram se tornar um analista de dados