Estatística para Análise de Dados com Python
Aplicado em Ciência de Dados, Análise de dados, Estatística, Economia, Engenharia, Machine Learning, Administração...
Description
O objetivo do curso é apresentar os principais conceitos Estatísticos necessários para qualquer análise de dados e ainda com a vantagem de obter esse aprendizado utilizando a linguagem de programação Python, uma das linguagens mais utilizadas no mundo.
O diferencial desse curso é que será trabalhado com um projeto real, com um conjunto de dados real e original e com mais de 800.000 registros e dezenas de variáveis (colunas). O projeto será mostrado desde o início, isto é, o carregamento do arquivo, o tratamento, manipulação e mineração desses dados e, é claro, as aplicações das técnicas estatísticas.
Será apresentado, tanto na teoria como na prática em Python, os conceitos fundamentais da Estatística Descritiva (amostragens, frequências, medidas de centralidade, posição e dispersão), Estatística Probabilística (probabilidades, distribuições discretas e contínuas) e Estatística Inferencial (intervalo de confiança, testes de hipóteses, correlação e regressão linear simples) para análise de dados.
O foco do curso é a aplicação prática das técnicas e testes estatísticos e com a linguagem Python, mas os conceitos teóricos são abordados de forma detalhada e de alto nível, de uma forma bem didática e passo a passo.
O curso é apresentado no sistema operacional Windows, mas usuários do Linux e Mac acompanham tranquilamente.
Todos os scripts, slides e conjuntos de dados são disponibilizados na área de recursos na plataforma de estudos.
What You Will Learn!
- Fundamentos da Linguagem Python (operadores , estrutura condicional, estrutura de repetição, listas, tuplas, dicionários, vetores, matrizes, funções e pacotes)
- Limpeza, organização e manipulação de dados
- Estatística descritiva para análise de dados (amostragens, frequências, medidas tendência central, medidas de posição, medidas dispersão e análise de outliers)
- Estatística probabilística para análise de dados (probabilidades, distribuição de Binomial, Geométrica, Poisson, distribuição normal e teste de normalidade).
- Estatística inferencial para análise de dados (testes paramétricos e não paramétricos, intervalo de confiança, testes de hipóteses...)
- Criação e Análise Gráfica pelo Matplotlib, Seaborn e Plotly. (Dispersão, linha, histograma, barras, boxplot, Q-Qplot)
- Manipulação das bibliotecas Pandas, Numpy, Scipy, StatsModels, Scikit-Learning...
Who Should Attend!
- Cientista de dados
- Analista de dados
- Estatístico
- Engenheiro
- Matemático
- Pesquisadores e estudantes que manipulam dados
- Economista
- Administrador
- Profissionais de Machine Learning
- Geógrafo
- Biomédico