Coding in R per l'analisi dati: da principiante a esperto

basi programmazione R | statistica | analisi dati | creazione grafici | data cleaning | eda | funzioni

Ratings: 4.45 / 5.00




Description

Questo corso di base di programmazione con R per aspiranti data analyst nasce per accompagnare un principiante nella programmazione, dalle basi del linguaggio di programmazione (uno dei più conosciuti e utilizzati nel campo dell'analisi dati) fino all'utilizzo della statistica descrittiva.

Al termine di questo corso lo studente sarà in grado di creare, importare, manipolare e gestire dei dataset. Il corso parte dall'impostazione dell'ambiente di lavoro:  vedremo come scaricare, installare e utilizzare alcuni dei più importanti strumenti per l'utilizzo di R, come RStudio.

Passeremo poi alla creazione degli oggetti: R si basa su alcune strutture che è necessario conoscere, come vettori, matrici, liste e dataframe. Una volta che avremo capito come creare e manipolare queste strutture dati, estrarne degli elementi e salvarle in locale sul computer, passeremo all'utilizzo di loop e alla creazione di funzioni.

Nella sezione successiva vedremo una serie argomenti utili: come impostare una cartella di lavoro, come installare e richiamare un pacchetto, come ottenere delle informazioni sui dati, dove trovare dei dataset per i test e ottenere aiuto su una funzione.

Quando si analizzano dei dati ci si imbatte prima o poi nei dataframe cosiddetti casi x variabili. Vedremo quindi come importare un dataframe dal computer, o da internet, su R. Esistono molte funzioni adatte allo scopo e molti pacchetti che ci sono utili per importare dei dati che sono in alcuni formati particolari, come ad esempio i formati per Excel, il .csv, il .txt o il JSON.

Vedremo poi come manipolare i dati, creare nuove variabili, aggregare i dati, ordinarli in maniera orizzontale e longitudinale, unire due dataset. Per fare questo utilizzeremo alcuni pacchetti e funzioni specifiche, come dplyr, tidyr o reshape2. Vedremo anche brevemente come interfacciarci a un database e utilizzare altri pacchetti per snellire la gestione di dataset un po' più grandi.

R è un linguaggio molto importante anche nell'ambito della statistica. Impareremo quindi alcune delle funzioni di base, come calcolo delle medie per riga o per colonna, e le funzioni statistiche più comuni nell'ambito della statistica descrittiva, come media, mediana, moda, la deviazione standard, la visualizzazione della distribuzione e altro ancora.

Quando si parla di analisi dati, ci troveremo spesso a creare dei grafici per spiegare i nostri dati e le nostre analisi. Per questo motivo dedichiamo una sezione del corso a vedere come creare dei grafici sia con le funzioni della libreria di base, sia con il pacchetto ggplot2.  

Nelle ultime lezioni del corso vedremo come creare e esportare dei report e delle slide, riepiloghiamo gli argomenti visti e le funzioni utilizzate, e vediamo il materiale di supporto.

What You Will Learn!

  • Le basi della programmazione con R
  • Impostare una sessione di lavoro
  • Creare oggetti e funzioni su R
  • Creare vettori, matrici, array, liste, fattori e dataframe
  • Convertire oggetti in R
  • Usare gli operatori logici
  • Usare le istruzioni condizionali o strutture di controllo
  • Esplorare i tuoi dati
  • Installare e richiamare i pacchetti per l'estensione delle funzionalità di R
  • Generare sequenze casuali su R
  • Estrarre degli elementi da un oggetto o da un dataset
  • Manipolare vettori, matrici, dataset
  • Gestire valori mancanti e dati duplicati
  • Manipolare le date
  • Importare file in vari formati, .csv, Excel, .txt e altri
  • Manipolare dataset, riorganizzandoli e aggregandoli
  • Ristrutturare e aggregare i dati
  • Creare grafici con le funzioni base e con i pacchetti più comuni
  • Creare ed esportare dei report in vari formati
  • Capire le basi della statistica con R

Who Should Attend!

  • Chi non ha conoscenze pregresse di R e vuole imparare direttamente in italiano
  • Chi cerca uno strumento semplice per imparare a programmare con uno dei linguaggi più utilizzati nell'analisi dati
  • *** Attenzione, R è un linguaggio utilizzato per l'analisi dati