Super Academia Data Science - 5 cursos em 1
Tudo sobre Data Science reunido em um único lugar - Python, Visualização no Python, R e WEKA
Description
As grandes empresas estão em busca de profissionais que saibam tratar e trabalhar dados, permitindo que novos insights sejam descobertos e aplicados ao seu negócio.
Criamos a SUPER ACADEMIA DATA SCIENCE para facilitar a sua necessidade de aprender as tecnlogias que estão atualmente sendo utilizadas pelas corporações. Destacamos PYTHON, R e WEKA neste cenário
R
No Nosso curso de Linguagem R o objetivo principal é permitir que aspectos básicos com ênfase no entendimento da linguagem R como sua estrutura e a forma de operação sejam compreendidos. O curso foi preparado e estruturado para que desde o iniciante até o mais avançado em técnicas estatísticas aprenda a trabalhar com a ferramenta R. O material pode ser acompanhado utilizando o R instalado em outros sistemas operacionais, tal como Windows ou Linux.
Durante o curso, o aluno terá que assistir as videoaulas e praticar diretamente no seu computador.
A ementa sumarizada é:
O que é a Linguagem R, Instalação da Ferramenta, Aprimoramento do Uso do R-Studio, Entendimento do Uso dos Objetos no R (Vetor, Matriz, Data Frame, Lista e Funções),Uso de Pacotes no R, Leitura de Arquivos no R, Sumarizando Dados, Gráficos com o R, Análise Estatística e o Uso Geral da Estatística, Uso de componentes como Mineração de Dados e o GOOGLE VIS.
Todo o curso de Linguagem R tem MATERIAL PRÓPRIO, um texto com tudo passo a passo, único e bem articulado.
Você entenderá os algoritmos e poderá praticar com suas bases de dados, seja arquivo texto ou banco de dados.
ORANGE
O ORANGE é uma das poucas ferramentas de mercado, totalmente construida em python, que o analista de dados pode trabalhar de forma totalmente visual, com um amplo aspecto de atendimento a diversas demandas na área de mineração de dados por meio do uso de algoritmos de Machine Learning.
ASPECTOS PRESENTES:
Aprendizado de máquina de código aberto e visualização de dados para iniciantes e especialistas. Fluxos de trabalho de análise de dados interativos com uma grande caixa de ferramentas
execute análise de dados simples com visualização inteligente de dados. Explore distribuições estatísticas, gráficos de dispersão ou mergulhe mais fundo com árvores de decisão, agrupamentos hierárquicos. Até seus dados multidimensionais podem se tornar sensíveis em 2D, especialmente com classificações e seleções inteligentes de atributos.
Exploração interativa de dados para análise qualitativa rápida com visualizações limpas. A interface gráfica do usuário permite que você se concentre na análise exploratória de dados em vez codificação, enquanto padrões inteligentes tornam extremamente fácil a criação rápida de protótipos de um fluxo de trabalho de análise de dados. Coloque widgets na tela, conecte-os, carregue seus conjuntos de dados e colete os insights!
Use vários complementos disponíveis no Orange para extrair dados de fontes de dados externas.
WEKA
Atualmente, a mineração de dados se mostra fundamental para a descoberta de novas informações e conhecimento, formatados em regras e padrões, a partir de grandes bases de dados. Nesta perspectiva, torna-se importante o desenvolvimento de um raciocínio crítico acerca dos principais conceitos, problemas e algoritmos relacionados à área de mineração de dados. Esta abordagem visa uma sintonia com as tendências empregadas atualmente no mercado no uso desta tecnologia de modo a preparar o futuro profissional a avaliar e, sobretudo, facilitar seu entendimento no emprego de metodologias e tecnologias avançadas.
O curso aborda o tema Mineração de Dados, através de aulas práticas e teóricas, utilizando-se de técnicas avançadas de descoberta de conhecimento, os quais provém a capacidade de descobrir novas informações, formatadas em regras e padrões, oriundas da análise de grandes bases de dados. Nesta perspectiva, o desenvolvimento de um raciocínio crítico acerca dos principais conceitos, problemas e algoritmos relacionados a área de Mineração de Dados é a principal habilidade adquirida por quem conclui o curso.
O conteúdo visto é praticado na ferramenta WEKA, que é gratuita e de fácil entendimento.
São 6 laboratórios totalmente práticos que você pode realizar durante o curso, detalhados e explicados passo a passo.
Você entenderá os algoritmos e poderá praticar com suas bases de dados, seja arquivo texto ou banco de dados.
Contará com um Framework integrado que apresenta os resultados estatísticos.
PYTHON
Neste curso você também verá Python. Python é uma linguagem de programação de alto nível que vem sendo adota em todas as grandes universidades do mundo todo. Neste curso você aprenderá conceitos básicos da linguagem Python, como estruturas condicionais e de repetição, manipulação de strings, listas e arquivos. Tudo isso apresentado com uma metodologia simples, direta e sem enrolação.
What You Will Learn!
- Entendendo o R
- Primeiros passos com o R
- Objetos no R
- Tipos de objetos: Matrizes, Listas
- Identificação de valores faltantes e especiais
- Salvar uma workspace
- Acesso pelo R-studio
- Entendimento dos diferentes tipos de pacotes
- Trabalhando com leitura de arquivos externos
- Lendo um arquivo na web
- Selecionando dados
- Gráficos (análise de dados e apresentação)
- Tipos de gráficos: Histogramas, Ramo e Folha, Box-plot, Gráfico de dispersão,Gráfico de barras, Setores
- Variáveis qualitativas: Nominais e Ordinais
- Análise univariada e bivariada
- Teste de uma distribuição normal
- Comparação de duas médias
- Regressão linear simples
- Mineração de dados com o R
- Instalação do R-studio e R
- Vetores,Data frames,Funções
- Workspace do r(área de trabalho)
- Leitura de uma workspace
- Pacotes do R
- Uso dos comandos library, intall package,require
- Leitura através do R-studio
- Sumarizando dados
- Uso dos conectores lógicos
- Exportando gráficos
- Programação: Comando FOR, Criando funções pelo R-studio, Uso de Estatísticas
- Variáveis quantitativas: Discretas e Continuas
- Teste de hipóteses
- Teste chi-quadrado para aderência
- Comparação de médias múltiplas pelo teste de Tukey
- Regressão linear múltipla
- Uso do Google Vis ( biblioteca gráfica do Google)
- Desenvolver programas usando a linguagem Python
- Manipular estruturas condicionais
- Mineração de arquivos com Python
- Manipular estruturas de repetição
- Realizar operações matemáticas usando Python
- Manipular strings
- Realizar operações lógicas
- Python
- Visualizar de dados com Python
- Conhecer a biblioteca MATPLOTLIB PYPLOT
- Construir gráficos de linhas, barras, dispersão e boxplot
- Contexto da Mineração de Dados - Descoberta de conhecimento em banco de dados, Aplicações práticas
- Entender o impacto da mineração de dados, Quais são os dados de entrada e saída na Mineração de Dados
- Aprender as técnicas de Mineração de Dados (Conceitos Básicos, Aprendizado de Máquina)
- Trabalhar com as técnicas: CLASSIFICAÇÃO, INDUÇÃO DE REGRAS, REGRAS DE ASSOCIAÇÃO, AGRUPAMENTO(CLUSTER) , REDES NEURAIS
- Utilizar os algoritmos: ÁRVORES DE DECISÃO, APRIORI, KMEANS,ETC
- Aprendizado Bayesiano (Operacionalização do conhecimento minerado e sua interpretação)
- Validação do conhecimento descoberto
- Aprendendo a utilizar o WEKA: uma ferramenta Java para Classificação, Associação, Clustering e Previsão
- Explanação de Interfaces Visuais para interpretação e divulgação do conhecimento (Mineração Visual)
- Entendimento e apresentação sobre MINERAÇÃO VISUAL- uso da biblioteca D3js
- Trabalhando Widget: Color, Distributions, Pivot Table
- Trabalhando Widget: Feature Statistics, Data Sample
- Trabalhando com Widget: Paint Data
- Trabalhando com Widget: Outliers ,Scatter Plot
- Trabalhando com: Create Class
- Trabalhando com: Select By data index
- Trabalhando com: Edit Domain
- Trabalhando com: Freeviz
- Trabalhando com: Árvore de Decisão
- Trabalhando com: Árvore de Decisão
- Trabalhando com: Cluster - Imagens
Who Should Attend!
- Estudantes, Profissionais da área de dados, Estatísticos
- Programadores Python interessados em aperfeiçoar seus conhecimentos