Questo corso mira a sviluppare le abilità computazionali e il pensiero inferenziale dello studente esplorando i concetti fondamentali nella gestione dei dati, nell’elaborazione, nel calcolo statistico e nella visualizzazione dinamica utilizzando moderni strumenti di programmazione e piattaforme web, utilizzando concetti, idee, protocolli ed esempi di set di dati reali osservativi, simulati e derivati dalla ricerca.
Competenze acquisite
Al termine del corso lo studente avrà acquisito la comprensione delle basi computazionali nella scienza dei Big Data, avrà sviluppato il proprio pensiero inferenziale critico e avrà sviluppato capacità applicative della materia in linguaggio R.
Programma
Algebra lineare e calcolo con matrici;
Riduzione della dimensionalità;
Classi bayesiane;
Algoritmi decisionali;
Previsioni regressive;
Modelli lineari regolarizzati;
Convalida incrociata delle previsioni;
Regole di associazione;
Clustering;
Modelli valutativi;
Miglioramenti dei modelli di performance;
Ottimizzazione dei formati e selezione delle funzioni;
Analisi longitudinale dei dati di grandi dimensioni.
Testi Consigliati
▪ D. GUPTA, Applied Analytics through Case Studies Using SAS and R: Implementing Predictive Models and Machine Learning Techniques, Apress, 2018
▪ Dispense distribuite dal docente
Modalità di Verifica
– Prova scritta con domande aperte e scelta multipla