APACHE HOP e Elasticsearch: dados e seus tratamentos

Aprenda a trabalhar com banco NoSQl e a ferramenta 100% para ingestão de dados

Ratings: 4.00 / 5.00




Description

Preparamos o que há de melhor na construção e aprendizado de duas das melhores ferramentas de mercado no trato e preparação de dados para análise de informações, estamos falando de APACHE HOP e Elastisearch.

Iniciaremos nosso curso trabalhando com o APACHE HOP que apresenta um portfólio fortíssimo no tratamento de dados. É uma ferramenta 100% visual, ou seja, a construção de seus projetos será sem uso de código, você terá a total liberdade de construir o que chamamos de pipeline, que é uma sequência de plugins (componentes + 400 disponíveis) para leitura de dados, gravação de dados, união de tabelas e arquivos, verificação de inconsistências, criação e eliminação de campos, dentre outras tarefas. Você conta ainda com a construção de Workflow, que permite o encadeamento de pipelines.

Já no treinamento de Elasticsearch, vamos trabalhar com o ecossistema do Elastic Stack ( Elasticsearch+logstash+kibana), será possível fazer a ingestão de dados pelo logstash, preparar o dado no Elasticsearch e criar incríveis dashboards no kibana, e tudo isso em um banco NoSQL, que você utilizará para até construir suas consultas em SQL.

As duas ferramentas fazem parte do projeto de qualquer profissional de dados, seja ele engenheiro de dados, cientista de dados ou analista de dados.

Então venha e conheça este treinamento que vai lhe ajudar a crescer no mercado da área de dados.

What You Will Learn!

  • O que é  Hop Orchestration Platform
  • Entendendo sobre fluxos de trabalho e pipelines
  • Entendendo sobre projetos e ambientes
  • Instalação do APACHE HOP
  • Criando pipelines com arquivos texto
  • Realizando tratamento de dados para entendimento do processo de engenharia de dados
  • O que são transformações, links e ações dentro de um pipeline
  • Construindo um workflow, orquestrador da sequência das operações
  • Entendendo o HOP GUI e seus componentes
  • Entendendo menu barras, principal e perspectivas
  • Criando sua área de projetos
  • Componentes pipelines: Sort, Select value, CSV file input, Value mapper, Filter rows, Dummy, Unique rows, Merge Join, Text File Output
  • Entendendo o que é : View output, Preview output , Debug output
  • Componentes pipelines: Number Range, Concat Field, String Operations, Replace in String, IF Field Value is Null, Split Fields, CSV File Input, Mail, File Exist
  • Leitura de dados em uma API: Rest Client, JSON Input, JSON Output
  • Construindo Workflow com execução de pipelines
  • Entendo o uso de variáveis globais no APACHE HOP
  • Automatização de pipeline ou workflow pelo HOP-RUN
  • Construindo pipelines em banco de dados Postgresql: Table Input, Table Output, Configurando conexão
  • Elasticsearch sobre o seu mecanismo criado para análise de dados e busca
  • Entender como é realizada a combinação de muitos tipos de buscas — estruturadas, não estruturadas
  • Compreender Elasticsearch usa APIs RESTful e JSON padrão
  • Aprendizado sobre Elasticsearch, Logstash e Kibana
  • Elasticsearch banco de dados NoSQL
  • Logstash ferramenta para ingestão de dados
  • Kibana ferramenta para criação de visualização de dados e Dashboards
  • Canvas utilizado para criação de infográficos, documentos e projetos gráficos com os dados
  • Compreender sobre como são armazenados os documentos
  • Entender a estrutura JSON de armazenamento
  • Entender sobre índices, tipos de documentos, documentos e campos
  • Entendimento do que são shards, conhecimento sobre partição de índices, conhecimento sobre réplica de shards
  • O que é um NÓ
  • Como utilizar e o que significa um Request Body
  • Como funciona a busca URI
  • Trabalhando com as aplicações Discover, Viazualize

Who Should Attend!

  • Estudantes e profissionais de computação, Informática, estatística, data science, analista de dados, engenheiro de dados
  • Pessoas interessadas em aprender os conceitos sobre ferramentas de ingestão de dados, ou que gostariam adentrar na área de engenharia de dados
  • Profissionais que, de alguma forma, utilizam dados no seu dia a dia
  • Desenvolvedores iniciantes de R e Python que desejam conhecer Elasticsearch