Orange , R e Weka - Estatística, Data Mining e Visualização

Trabalhe com dados utilizando algoritmos de Machine Learning e muitas informações visuais

Ratings: 4.39 / 5.00




Description

As grandes empresas estão em busca de profissionais que saibam tratar e trabalhar dados, permitindo que novos insights sejam descobertos e aplicados ao seu negócio.

Pensando nesta necessidade que é cada vez mais crescente, colocamos juntas três(3) das principais ferramentas de mercado no tratamento de dados e na descoberta de informações.

DATA MINING:

Atualmente, a mineração de dados se mostra fundamental para a descoberta de novas informações e conhecimento, formatados em regras e padrões, a partir de grandes bases de dados. Nesta perspectiva, torna-se importante o desenvolvimento de um raciocínio crítico acerca dos principais conceitos, problemas e algoritmos relacionados à área de mineração de dados. Esta abordagem visa uma sintonia com as tendências empregadas atualmente no mercado no uso desta tecnologia de modo a preparar o futuro profissional a avaliar e, sobretudo, facilitar seu entendimento no  emprego de metodologias e tecnologias avançadas.

O curso aborda o tema Mineração de Dados, através de aulas práticas e teóricas, utilizando-se de técnicas avançadas de descoberta de conhecimento, os quais provém a capacidade de descobrir novas informações, formatadas em regras e padrões, oriundas da análise de grandes bases de dados. Nesta perspectiva, o desenvolvimento de um raciocínio crítico acerca dos principais conceitos, problemas e algoritmos relacionados a área de Mineração de Dados é a principal habilidade adquirida por quem conclui o curso.

Todo o conteúdo visto é praticado na ferramenta WEKA, que é gratuita e de fácil entendimento. 

São 6 laboratórios totalmente práticos que você pode realizar durante o curso, detalhados e explicados passo a passo.


ORANGE:

É uma das poucas ferramentas de mercado, totalmente construida em python, que o analista de dados  pode trabalhar de forma totalmente visual, com um amplo aspecto de atendimento a diversas demandas na área de mineração de dados por meio do uso de  algoritmos de Machine Learning.

ASPECTOS PRESENTES:

  • Aprendizado de máquina de código aberto e visualização de dados para iniciantes e especialistas. Fluxos de trabalho de análise de dados interativos com uma grande caixa de ferramentas

  • execute análise de dados simples com visualização inteligente de dados. Explore distribuições estatísticas, gráficos de dispersão ou mergulhe mais fundo com árvores de decisão, agrupamentos hierárquicos. Até seus dados multidimensionais podem se tornar sensíveis em 2D, especialmente com classificações e seleções inteligentes de atributos.

  • Exploração interativa de dados para análise qualitativa rápida com visualizações limpas. A interface gráfica do usuário permite que você se concentre na análise exploratória de dados em vez codificação, enquanto padrões inteligentes tornam extremamente fácil a criação rápida de protótipos de um fluxo de trabalho de análise de dados. Coloque widgets na tela, conecte-os, carregue seus conjuntos de dados e colete os insights!

  • Use vários complementos disponíveis no Orange para extrair dados de fontes de dados externas.


Este curso é o ROADMAP ONE, que contempla a base para iniciar os seus projetos de mineração de dados. Contará ainda com o ROADMAP TWO que dará ênfase aos algoritmos de machine learning mais complexos.


R:

R é um ambiente computacional e uma linguagem de programação que vem progressivamente se especializando em manipulação, análise e visualização gráfica de dados. Na atualidade é considerado o melhor ambiente computacional para essa finalidade. O ambiente está disponível para diferentes sistemas operacionais: Unix/Linux, Mac e Windows.

Foi criado originalmente por Ross Ihaka e por Robert Gentleman no departamento de Estatística da Universidade de Auckland, Nova Zelândia. Posteriormente, foi desenvolvido pelo esforço colaborativo de pessoas em vários locais do mundo

Todo o curso de Linguagem R tem MATERIAL PRÓPRIO, um texto com tudo passo a passo, único e bem articulado.

Agora vamos a descrição do nosso curso de Linguagem R. O objetivo principal do curso é permitir que aspectos básicos com ênfase no entendimento da linguagem R como sua estrutura e a forma de operação sejam compreendidos. O curso foi preparado e estruturado para que desde o iniciante até o mais avançado em técnicas estatísticas aprenda a trabalhar com a ferramenta R. O material pode ser acompanhado utilizando o R instalado em outros sistemas operacionais, tal como Windows ou Linux.

Durante o curso, o aluno terá que assistir as videoaulas e praticar diretamente no seu computador. 

A ementa sumarizada é:O que é a Linguagem R, Instalação da Ferramenta, Aprimoramento do Uso doR-Studio, Entendimento do Uso dos Objetos no R (Vetor, Matriz, Data Frame, Lista e Funções),Uso de Pacotes no R, Leitura de Arquivos no R, Sumarizando Dados, Gráficos com o R, Análise Estatística e o Uso Geral da Estatística, Uso de componentes como Mineração de Dados e o GOOGLE VIS.

Venha e junte-se aos seus colegas.


QUEM SOU EU:

- Profissional da área de dados há 15 anos.

- Tenho Mais de 8 anos na área EAD.

- Sou professor de pós-graduação na área de dados há mais de 8 anos.

SEJA MAIS UM ALUNO DESTE CLUBE QUE NÃO PARA DE CRESCER!


What You Will Learn!

  • Entendendo o R
  • Instalação do R-studio e R
  • Primeiros passos com o R
  • Uso do help
  • Objetos no R
  • Tipos de objetos
  • Vetores
  • Matrizes
  • Data frames
  • Listas
  • Funções
  • Identificação de valores faltantes e especiais
  • Workspace do r(área de trabalho)
  • Salvar uma workspce
  • Leitura de uma workspace
  • Acesso pelo R-studio
  • Pacotes do R
  • Entendimento dos diferentes tipos de pacotes
  • Uso dos comandos library, intall package,require
  • Trabalhando com leitura de arquivos externos
  • Leitura através do R-studio
  • Lendo um arquivo na web
  • Sumarizando dados
  • Selecionando dados
  • Uso dos conectores lógicos
  • Gráficos (análise de dados e apresentação)
  • Exportando gráficos
  • Tipos de gráficos: Histogramas, Ramo e Folha, Box-plot, Gráfico de dispersão,Gráfico de barras, Setores
  • Programação: Comando FOR, Criando funções pelo R-studio, Uso de Estatísticas
  • Variáveis qualitativas: Nominais e Ordinais
  • Variáveis quantitativas: Discretas e Continuas
  • Análise univariada e bivariada
  • Teste de hipóteses
  • Teste de uma distribuição normal
  • Teste chi-quadrado para aderência
  • Comparação de duas médias
  • Comparação de médias múltiplas pelo teste de Tukey
  • Regressão linear simples,Regressão linear múltipla
  • Mineração de dados com o R
  • Uso do Google Vis (biblioteca gráfica do Google)
  • Machine Learning
  • Agrupamento, descoberta de grupos em dados
  • Classificação e modelagem preditiva
  • Algoritmos de Mineração
  • Análise Estatística
  • Trabalhando Widget: Color, Distributions, Pivot Table
  • Trabalhando Widget: Feature Statistics, Data Sample
  • Trabalhando com Widget::Paint Data
  • Trabalhando com Widget::Outliers ,Scatter Plot
  • Trabalhando com : Create Class
  • Trabalhando com :Select By data index
  • Trabalhando com :Edit Domain
  • Trabalhando com: Freeviz
  • Trabalhando com: Árvore de Decisão
  • Trabalhando com: Cluster - Imagens
  • Trabalhando com: Correlação
  • Trabalhando com: Cluster – K-means
  • Contexto da Mineração de Dados - Descoberta de conhecimento em banco de dados, Aplicações práticas
  • Entender o impacto da mineração de dados, Quais são os dados de entrada e saída na Mineração de Dados
  • Aprender as técnicas de Mineração de Dados (Conceitos Básicos, Aprendizado de Máquina)
  • Trabalhar com as técnicas: CLASSIFICAÇÃO, INDUÇÃO DE REGRAS, REGRAS DE ASSOCIAÇÃO, AGRUPAMENTO(CLUSTER) , REDES NEURAIS
  • Utilizar os algoritmos: ÁRVORES DE DECISÃO, APRIORI, KMEANS,ETC
  • Aprendizado Bayesiano (Operacionalização do conhecimento minerado e sua interpretação)
  • Validação do conhecimento descoberto
  • Aprendendo a utilizar o WEKA: uma ferramenta Java para Classificação, Associação, Clustering e Previsão
  • Explanação de Interfaces Visuais para interpretação e divulgação do conhecimento (Mineração Visual)
  • Entendimento e apresentação sobre MINERAÇÃO VISUAL- uso da biblioteca D3js

Who Should Attend!

  • Estatísticos, Analistas de Banco de Dados, Analistas de Dados, Analistas de BI, Estudantes da área de Dados