KNIME Analytics Platform per Data Scientists, intermediate

Implementare gli algoritmi di machine learning senza usare codice. Salire di livello.

Ratings: 4.57 / 5.00




Description

Questo corso di rivolge alle persone che manipolano i dati per la loro attività (studenti, professionisti) e vorrebbero utilizzare gli algoritmi di machine learning per il data mining ma non hanno voglia o tempo di imparare un linguaggio di programmazione, come R o Python.

Fortunatamente ci sono strumenti che permettono di raggiungere gli stessi obiettivi, senza utilizzare una riga di codice (a meno che non si voglia proprio farlo).

Tra questi, sicuramente, KNIME Analytics Platform, o più semplicemente KNIME® è il più conosciuto e utilizzato in questo ambito.

KNIME® è un ambiente completo e Open Source per l'analisi dei dati e il machine learning, che permette l'uso degli algoritmi di data mining più diffusi all'interno di un Workbench visuale, grazie all'utilizzo di componenti software, detti nodi, che combinati in maniera opportuna, permettono di elaborare qualsiasi base di dati.

Il corso, di livello intermedio, copre aspetti avanzati di KNIME, che consentono di migliorare l'esperienza di uso e di utilizzo e si compone di 8 sezioni:


  1. Flow variables: consentono di rendere dinamica l'esecuzione di un workflow sulla base di come evolvono certe informazioni al suo interno

  2. Gestione di Date & Time: verranno trattati i nodi che permettono la manipolazione di data e ora, il calcolo di durate, la gestione dei dati su medie mobili

  3. Controllo del flusso: Loop, If, Case, Break, gestione degli errori.

  4. Gestire i dati in un DBMS: collegarsi ad un DBMS, creare o modificare tabelle, inserire, modificare, cancellare righe su una tabella tutto senza conoscere l'SQL (ma anche conoscendolo)

  5. Aspetti avanzati di Machine Learning: Ensemble (Bagging, Bootstrap, Boosting), Cross Validation), Reti Neurali FFNN, CNN, RNN

  6. Component: creare ed adoperare un Component all'interno di KNIME Server

  7. Visualizzazione dei dati: utilizzare i nodi di visualizzazione Plotly e KNIME views (Labs)

  8. Esportare i dati: inviare i dati di un'elaborazione da KNIME a Power BI®

In tutte le sezioni si utilizzerà prevalentemente KNIME®, mostrando alcune implementazioni di data mining con dati pubblici e fornendo numerosi esempi tratti dal sito Hub di KNIME.


NOTE dell'autore:

KNIME® è un marchio registrato e il logo e il marchio OPEN FOR INNOVATION® sono utilizzati da KNIME AG su licenza di KNIME GmbH e sono registrati negli Stati Uniti. KNIME® è anche registrato in Germania.

L'autore non é collegato in alcun modo all'azienda.

Il corso è stato sviluppato sulle tracce dei corsi self paced [L2-DS] KNIME Analytics Platform for Data Scientists: Advanced e [L2-DW] KNIME Analytics Platform for Data Wranglers: Advanced, disponibili, in lingua inglese, sul sito di KNIME.

Gli esempi mostrati durante le lezioni sono per lo più disponibili sul sito KNIME Hub, cui si rimanda nelle risorse presenti alla fine di ogni lezione del corso.

La main version di KNIME utilizzata negli esempi è la 4.6 o 4.7

Gli esempi che utilizzano KNIME Server sono stati creati con la versione 4.5


What You Will Learn!

  • Conoscere aspetti avanzati di KNIME Analytics Platform
  • Gestire e manipolare i valori di data e ora presenti nei dataset
  • Costruire dei cicli per iterare rami di un Workflow in base ad una feature, o una sua porzione , un certo numero di volte, fino al verificarsi di una condizione
  • Trasformare le feature di un dataset in variabili per modificare il comportamento di un Workflow o effettuare manipolazioni
  • Conoscere tecniche avanzate di machine learning, come l'ensemble e le reti neurali profonde
  • Approfondire i nodi per le gestione dei database
  • Approfondire i nodi per la visualizzazione
  • Inviare i dati elaborati verso Power BI

Who Should Attend!

  • Studenti di Ingegneria, Statistica, Matematica
  • Professionisti che nel lavoro hanno a che fare con i dati e che finora hanno utilizzato Excel o Microsoft Access per le loro analisi
  • Curiosi e appassionati di data mining, che non vogliono imparare un linguaggio di programmazione per usare le tecniche di machine learning.