CFU: 7
Il corso ha come scopo permettere agli studenti di
conoscere nella pratica le diverse tecnologie disponibili per l'analisi dei big
data tramite la conduzione di casi di studio concreti.
Programma
1. Caratteristiche dei big data
2. I sistemi Hadoop e Spark per la gestione dei big data
3. Programmazione secondo il paradigma Map Reduce e Resilient Distributed
Dataset per la risoluzione di casi applicativi reali
4. Basi di dati NoSQL per
la memorizzazione di dati non relazionali
5. Librerie di data mining e machine
learning per big data: MLlib
6. Studio di casi applicativi di progettazione di
sistemi per l'analisi dei dati nell'ambito dei big data.