Coding in R per l'analisi dati: da principiante a esperto
basi programmazione R | statistica | analisi dati | creazione grafici | data cleaning | eda | funzioni
Description
Questo corso di base di programmazione con R per aspiranti data analyst nasce per accompagnare un principiante nella programmazione, dalle basi del linguaggio di programmazione (uno dei più conosciuti e utilizzati nel campo dell'analisi dati) fino all'utilizzo della statistica descrittiva.
Al termine di questo corso lo studente sarà in grado di creare, importare, manipolare e gestire dei dataset. Il corso parte dall'impostazione dell'ambiente di lavoro: vedremo come scaricare, installare e utilizzare alcuni dei più importanti strumenti per l'utilizzo di R, come RStudio.
Passeremo poi alla creazione degli oggetti: R si basa su alcune strutture che è necessario conoscere, come vettori, matrici, liste e dataframe. Una volta che avremo capito come creare e manipolare queste strutture dati, estrarne degli elementi e salvarle in locale sul computer, passeremo all'utilizzo di loop e alla creazione di funzioni.
Nella sezione successiva vedremo una serie argomenti utili: come impostare una cartella di lavoro, come installare e richiamare un pacchetto, come ottenere delle informazioni sui dati, dove trovare dei dataset per i test e ottenere aiuto su una funzione.
Quando si analizzano dei dati ci si imbatte prima o poi nei dataframe cosiddetti casi x variabili. Vedremo quindi come importare un dataframe dal computer, o da internet, su R. Esistono molte funzioni adatte allo scopo e molti pacchetti che ci sono utili per importare dei dati che sono in alcuni formati particolari, come ad esempio i formati per Excel, il .csv, il .txt o il JSON.
Vedremo poi come manipolare i dati, creare nuove variabili, aggregare i dati, ordinarli in maniera orizzontale e longitudinale, unire due dataset. Per fare questo utilizzeremo alcuni pacchetti e funzioni specifiche, come dplyr, tidyr o reshape2. Vedremo anche brevemente come interfacciarci a un database e utilizzare altri pacchetti per snellire la gestione di dataset un po' più grandi.
R è un linguaggio molto importante anche nell'ambito della statistica. Impareremo quindi alcune delle funzioni di base, come calcolo delle medie per riga o per colonna, e le funzioni statistiche più comuni nell'ambito della statistica descrittiva, come media, mediana, moda, la deviazione standard, la visualizzazione della distribuzione e altro ancora.
Quando si parla di analisi dati, ci troveremo spesso a creare dei grafici per spiegare i nostri dati e le nostre analisi. Per questo motivo dedichiamo una sezione del corso a vedere come creare dei grafici sia con le funzioni della libreria di base, sia con il pacchetto ggplot2.
Nelle ultime lezioni del corso vedremo come creare e esportare dei report e delle slide, riepiloghiamo gli argomenti visti e le funzioni utilizzate, e vediamo il materiale di supporto.
What You Will Learn!
- Le basi della programmazione con R
- Impostare una sessione di lavoro
- Creare oggetti e funzioni su R
- Creare vettori, matrici, array, liste, fattori e dataframe
- Convertire oggetti in R
- Usare gli operatori logici
- Usare le istruzioni condizionali o strutture di controllo
- Esplorare i tuoi dati
- Installare e richiamare i pacchetti per l'estensione delle funzionalità di R
- Generare sequenze casuali su R
- Estrarre degli elementi da un oggetto o da un dataset
- Manipolare vettori, matrici, dataset
- Gestire valori mancanti e dati duplicati
- Manipolare le date
- Importare file in vari formati, .csv, Excel, .txt e altri
- Manipolare dataset, riorganizzandoli e aggregandoli
- Ristrutturare e aggregare i dati
- Creare grafici con le funzioni base e con i pacchetti più comuni
- Creare ed esportare dei report in vari formati
- Capire le basi della statistica con R
Who Should Attend!
- Chi non ha conoscenze pregresse di R e vuole imparare direttamente in italiano
- Chi cerca uno strumento semplice per imparare a programmare con uno dei linguaggi più utilizzati nell'analisi dati
- *** Attenzione, R è un linguaggio utilizzato per l'analisi dati