Politecnico di Torino
Politecnico di Torino
   
Login  
en
Politecnico di Torino
Anno Accademico 2017/18
01RLBPG, 01RLBNG
Business intelligence per big data
Corso di Laurea Magistrale in Ingegneria Gestionale - Torino
Corso di Laurea Magistrale in Ingegneria Matematica - Torino
Docente Qualifica Settore Lez Es Lab Tut Anni incarico
Cerquitelli Tania ORARIO RICEVIMENTO A2 ING-INF/05 50 9 21 0 4
SSD CFU Attivita' formative Ambiti disciplinari
ING-INF/05 8 B - Caratterizzanti Discipline ingegneristiche
Presentazione
Insegnamento facoltativo per la Laurea Magistrale in Ingegneria Gestionale, collocato al II pd del II anno. Con il termine business intelligence per big data si descrivono tutte le attività di analisi di elevati volumi di dati per il supporto delle decisioni aziendali. Il corso descrive le modalità di storicizzazione, gestione e interrogazione delle basi di dati destinate all’analisi dei dati. Queste basi di dati sono normalmente denominate data warehouse e sono tipicamente caratterizzate dalla necessità di gestire grandi volumi di dati. Nel corso sono descritte sia i sistemi di data warehouse relazionali sia quelli non relazionali, sia le tecniche più tradizionali di analisi OLAP (On Line Analytical Processing) dei dati, sia le analisi complesse basate su tecniche di data mining. Le attività di laboratorio permettono di sperimentare vari strumenti per l’analisi dei dati.
Risultati di apprendimento attesi
• Conoscenza dell’architettura dei sistemi per l’analisi dei dati (data warehouse) e delle metodologie di progettazione concettuale, logica e fisica di un data warehouse.
• Capacità di progettare un data warehouse.
• Conoscenza dei costrutti del linguaggio SQL per la formulaz ione di interrogazioni OLAP per data warehouse.
• Capacità di scrivere interrogazioni OLAP nel linguaggio SQL.
• Conoscenza dei principali algoritmi di data mining per la classificazione, il clustering e l’estrazione di regole di associazione
• Conoscenza delle tecniche di analisi dei dati per il CRM (Customer Relationship Management).
• Capacità di svolgere analisi dei dati mediante tecniche di data mining.
Prerequisiti / Conoscenze pregresse
Conoscenza del modello relazionale e del linguaggio SQL e competenze di base di programmazione.
Programma
Argomenti trattati nelle lezioni e relativo peso in crediti:
• Data warehouse: architettura, metodologie di progettazione concettuale, logica e fisica, istruzioni in linguaggio SQL per la formulazione di interrogazioni OLAP (1.5 cfu)
• Basi di dati non relazionali (0.3 cfu)
• Algoritmi di data mining: classificazione, clustering ed estrazione di regole di associazione (1.8 cfu)
• Tecniche di analisi dei dati per il CRM (Customer Relationship Management) (0.2 cfu)
• Studio di casi applicativi di progettazione di data warehouse e analisi dei dati (0.6 cfu).
Organizzazione dell'insegnamento
Il corso comprende esercitazioni in aula inerenti gli argomenti trattati nelle lezioni, e in particolare sul linguaggio SQL e sulla progettazione concettuale, logica e fisica di data warehouse (1.6 cfu). Gli studenti svolgeranno inoltre esercitazioni individuali durante il corso, per cui dovranno predisporre una relazione che contribuirà a determinare il voto finale. Il corso comprende esercitazioni in laboratorio sull’utilizzo del linguaggio SQL, sulla progettazione di data warehouse e sulle tecniche di data mining. L’attività di laboratorio prevede lo sviluppo di un progetto completo basato su casi di studio (2.0 cfu). L'attività di laboratorio permette di sperimentare l'uso dei prodotti commerciali e open-source più diffusi.
Testi richiesti o raccomandati: letture, dispense, altro materiale didattico
Testi di riferimento:
- Golfarelli, Rizzi, "Data warehouse: teoria e pratica della progettazione", 2 ed., McGraw Hill, 2006.
- Tan, Steinbach, Kumar, "An introduction to data mining", Addison Wesley, 2005.
Sono disponibili copie dei lucidi utilizzati nelle lezioni, esempi di scritti di esame ed esercizi, e i manuali per le esercitazioni di laboratorio. Tutto il materiale didattico è scaricabile da un sito web o attraverso il portale.
Criteri, regole e procedure per l'esame
L'esame è costituito da una prova scritta della durata di 2 ore, dalla valutazione delle relazioni sulle
esercitazioni individuali assegnate durante il corso e da una prova orale su un progetto di analisi di dati da svolgersi in coppia con un altro studente. Le esercitazioni individuali sono facoltative. Il voto finale è definito in base alla valutazione della prova scritta ed eventualmente dalle relazioni delle esercitazioni e della valutazione della prova orale sul progetto di analisi di dati su un dataset reale. Le relazioni delle esercitazioni individuali sono considerate solo se la valutazione della prova scritta è pari o superiore a 18. Il voto finale è una media (approssimata) del voto della prova scritta, del voto delle relazioni individuali e del voto dell'orale.

La prova scritta comprende:
- 1 esercizio sulla progettazione concettuale e logica di un data warehouse (max 12 punti)
- la scrittura di 3 interrogazioni di accesso ai dati mediante il linguaggio SQL esteso (max 15 punti)
- la progettazione fisica di un data warehouse (max 2 punti)
- la discussione della dinamicità dei dati memorizzati nel data warehouse (max 1 punto)
Durante la prova scritta gli studenti possono consultare libri o appunti. La valutazione degli esercizi della prova scritta si basa sulla correttezza del risultato e sull'appropriatezza delle metodologie di risoluzione applicate.

La prova orale verte sul progetto di analisi di dati su un dataset reale da svolgersi in coppia con un altro studente (max 30 Lode). Le relazioni individuali assegnate durante il corso vertono sui principali argomenti trattati durante il corso (max 2 punti).
Orario delle lezioni
Statistiche superamento esami

Programma definitivo per l'A.A.2017/18
Indietro



© Politecnico di Torino
Corso Duca degli Abruzzi, 24 - 10129 Torino, ITALY
WCAG 2.0 (Level AA)
Contatti