Introduzione a Python per il data mining

Python dalle basi per aspiranti data analyst

Ratings: 4.74 / 5.00




Description

Questo corso base sui Python si pone l'obiettivo di accompagnare chi non conosce questo linguaggio attraverso le basi del linguaggio stesso verso i concetti più importanti del data mining. 

Python è uno dei linguaggi di programmazione più conosciuti e utilizzati nel campo dell'analisi dati e data science. Questo corso si rivolge soprattutto a chi vuole proviene da un altro linguaggio o non sa programmare, ma vuole imparare a farlo in un'ottica di analisi dati. 

Questo corso Python ti spiega per prima cosa sono e come creare degli oggetti: Python si basa su alcune strutture che è necessario conoscere, come tuple, liste, set, dizionari e dataframe. In questo corso Python imparerai a crearle e manipolarle.

Una volta create queste strutture dati, imparerai a manipolarle, salvarle sul computer ed estrarne degli elementi. In questo corso Python ti insegnerò anche le basi di creazione di una funzione. 

Nelle sezioni del corso Python imparerai una serie argomenti utili: come impostare una cartella di lavoro, come installare e richiamare un pacchetto, come ottenere delle informazioni sui dati, dove trovare dei dataset per i test, come rimuovere degli elementi duplicati, come iterare un'azione e come gestire le date. Parleremo anche di alcune nozioni importanti nella programmazione ad oggetti, ad esempio come creare una classe e come gestire errori ed eccezioni. 

Quando si analizzano dei dati ci si imbatte prima o poi nei dataframe cosiddetti casi x variabili. In questo corso Python imparerai come si importa un dataframe dal computer, o da internet. 

Un altro argomento importante cha affrontiamo in questo corso Python è come gestire i dati, come manipolarli, modificarli, aggregarli, ordinarli in maniera orizzontale e longitudinale. Per fare questo utilizzeremo alcuni pacchetti e funzioni specifiche, come pandas, uno dei pacchetti più importanti per l'analisi dati in Python.

Una delle strutture più importanti nella programmazione Python è l'array creato col pacchetto Numpy: grazie a questo pacchetto imparerai a manipolare questo tipo di struttura e a generare dei dataset casuali.

Quando si parla di analisi dati, ci troveremo spesso a creare dei grafici per spiegare i nostri dati e le nostre analisi. Per questo motivo dedichiamo una sezione del corso Python a vedere come creare dei grafici sia con le funzioni della libreria di base, sia con il pacchetto Matplotlib.  

Nelle ultime parti del corso Python cercherò di darti un'idea del pacchetto scikit-learn, uno dei più importanti quando si parla di machine learning. Per ultimo riepilogheremo gli argomenti visti e vedremo come gestire le date e reperire dei dataset online per i test. 


What You Will Learn!

  • Installare Python
  • Avere un'idea dei vari editor e ambienti di programmazione
  • Capire le differenze tra Python2 Python3
  • Impostare una working directory
  • Creare oggetti
  • Inserire commenti
  • Conoscere gli operatori
  • Riconoscere le strutture dati di Python: tuple, liste, dizionari, stringhe
  • Capire e creare funzioni semplici
  • Capire e utilizzare le funzioni condizionali
  • Capire le basi della programmazione orientata agli oggetti e altri concetti fondamentali come metodi, moduli, pacchetti
  • Importare files dal computer
  • Utilizzare i pacchetti per il data mining: pandas, numpy e scipy, matplotlib
  • Avere un'idea del codice per il machine learning e del machine learning col pacchetto scisti-learn
  • Gestire le date
  • Conoscere le fonti di dataset più utilizzate per i test

Who Should Attend!

  • Chi vuole imparare Python per l'analisi dati dalle basi
  • Chi conosce un altro linguaggio di programmazione in ambito analisi dati e si affaccia a Python per la prima volta
  • *** Attenzione, Python è presentato in questo corso con finalità di analisi dati