PORTALE DELLA DIDATTICA

PORTALE DELLA DIDATTICA

PORTALE DELLA DIDATTICA

Elenco notifiche



Data Science e Tecnologie per le Basi di Dati

01SQMOV

A.A. 2018/19

Lingua dell'insegnamento

Italiano

Corsi di studio

Corso di Laurea Magistrale in Ingegneria Informatica (Computer Engineering) - Torino

Mutua

01NVUNG

Organizzazione dell'insegnamento
Didattica Ore
Lezioni 43
Esercitazioni in aula 25
Esercitazioni in laboratorio 12
Tutoraggio 60
Docenti
Docente Qualifica Settore h.Lez h.Es h.Lab h.Tut Anni incarico
Baralis Elena Maria Professore Ordinario IINF-05/A 43 17 0 0 7
Collaboratori
Espandi

Didattica
SSD CFU Attivita' formative Ambiti disciplinari
ING-INF/05
ING-INF/05
4
4
F - Altre attività (art. 10)
B - Caratterizzanti
Abilità informatiche e telematiche
Ingegneria informatica
2018/19
Insegnamento obbligatorio per la Laurea Magistrale in Ingegneria Informatica, collocato al I pd del I anno. Il corso descrive gli aspetti fondamentali della tecnologia dei sistemi per la gestione delle basi di dati e le modalità di gestione delle basi di dati destinate all'analisi dei dati (normalmente denominate data warehouse), tipicamente caratterizzate dalla necessità di gestire grandi volumi di dati. Sono considerate sia le tecniche più tradizionali di analisi OLAP (On Line Analytical Processing) dei dati, sia le analisi complesse basate su tecniche di data mining. Le attività di laboratorio permettono di valutare le caratteristiche tecnologiche dei prodotti commerciali più diffusi e di sperimentare vari strumenti per l'analisi dei dati.
The course is taught in Italian. The course, compulsory for the Master degree in Computer Engineering, is offered on the 1st semester of the 1st year. The course addresses the fundamental issues in the technology of database management systems and introduces database management techniques for data warehouses (database systems specialized in strategic decision support), typically characterized by the need of managing very large databases. Both traditional OLAP (On Line Analytical Processing) analysis techniques and complex data mining techniques will be addressed. Laboratory sessions allow experimental activities, both on technological characteristics and data analysis, on the most widespread commercial and open-source products.
- Conoscenza delle caratteristiche tecnologiche di un sistema per la gestione di basi di dati: gestione dell'accesso concorrente ai dati, affidabilità, strutture del livello fisico, ottimizzazione dell'accesso ai dati. - Capacità di eseguire la progettazione fisica di una base di dati relazionale. - Conoscenza dell'architettura delle basi di dati distribuite e della gestione della replicazione. - Conoscenza delle basi di dati attive e dei costrutti del linguaggio SQL per la definizione dei trigger. - Capacità di scrivere trigger nel linguaggio SQL. - Conoscenza dell'architettura dei sistemi per l'analisi dei dati (data warehouse) e delle metodologie di progettazione concettuale, logica e fisica di un data warehouse. - Capacità di progettare un data warehouse. - Conoscenza dei costrutti del linguaggio SQL per la formulazione di interrogazioni OLAP per data warehouse. - Capacità di scrivere interrogazioni OLAP nel linguaggio SQL. - Conoscenza dei principali algoritmi di data mining per la classificazione, il clustering e l'estrazione di regole di associazione
- Knowledge of the main technological characteristics of a database management system: concurrent data access management, reliability, physical level structures, data access optimization. - Ability to design the physical data structures for a relational database. - Knowledge of distributed database system architecture and replication management. - Knowledge of active database systems and SQL statements for trigger definition. - Ability to write triggers in the SQL language. - Knowledge of data warehouse architecture and of the methodology for conceptual, logical, and physical design of a data warehouse. - Ability to design a data warehouse. - Knowledge of the SQL statements for OLAP queries in a data warehouse. - Ability to write OLAP queries in the SQL language. - Knowledge of the major data mining algorithms for classification, clustering, and association rule mining.
Conoscenza del modello relazionale e del linguaggio SQL e competenze di base di programmazione.
Knowledge of the relational model and SQL language and basic programming skills.
Argomenti trattati nelle lezioni e relativo peso in crediti: - Caratteristiche tecnologiche di un sistema per la gestione di basi di dati: gestione dell'accesso concorrente, affidabilità, strutture del livello fisico, ottimizzazione dell'accesso (1.8 cr.) - Basi di dati attive e costrutti del linguaggio SQL per la definizione dei trigger (0.4 cr.) - Architettura delle basi di dati distribuite e gestione della replicazione (0.4 cr.) - Data warehouse: architettura, metodologie di progettazione concettuale, logica e fisica, istruzioni in linguaggio SQL per la formulazione di interrogazioni OLAP (1.4 cr.) - Algoritmi di data mining: classificazione, clustering ed estrazione di regole di associazione (1.6 cr.)
- Technological characteristics of a database management system: concurrent data access management, reliability, physical level structures, data access optimization (1.8 cr.) - Active database systems and SQL statements for trigger definition (0.4 cr.) - Distributed database system architecture and replication management (0.4 cr.) - Data warehouses: architecture, methodology for conceptual, logical, and physical design, SQL statements for OLAP queries (1.4 cr.) - Data mining algorithms: classification, clustering, and association rule mining (1.6 cr.)
Il corso comprende esercitazioni in aula inerenti gli argomenti trattati nelle lezioni, e in particolare sul linguaggio SQL, sulla progettazione fisica di basi di dati relazionali, sulla progettazione concettuale, logica e fisica di data warehouse (1.2 cr.). Gli studenti svolgeranno inoltre esercitazioni individuali durante il corso, per cui dovranno predisporre una relazione che contribuirà a determinare il voto finale. Il corso comprende esercitazioni in laboratorio sull'utilizzo del linguaggio SQL (anche per la progettazione fisica di basi di dati) e sulla progettazione di data warehouse (1.2 cr). L'attività di laboratorio permette di sperimentare l'uso dei prodotti commerciali e open-source più diffusi.
The course includes practices on the lecture topics, and in particular SQL language, physical database design, and conceptual, logical, and physical data warehouse design (1.8 cr.). Students will prepare an individual written report on exercises proposed during the course. The report will contribute to the final exam grade. The course includes laboratory sessions on the SQL language (also for database physical design) and data warehouse design (1.2 cr.). Laboratory sessions allow experimental activities on the most widespread commercial and open-source products.
I testi, scelti tra quelli elencati, saranno comunicati a lezione dal docente titolare dell'insegnamento: - Atzeni, Ceri, Fraternali, Paraboschi, Torlone, 'Basi di dati ' Architetture e linee di evoluzione', 2 ed., McGraw Hill, 2007. - Golfarelli, Rizzi, 'Data warehouse: teoria e pratica della progettazione', 2 ed., McGraw Hill, 2006. - Tan, Steinbach, Kumar, 'An introduction to data mining', Addison Wesley, 2005. Sono disponibili copie dei lucidi utilizzati nelle lezioni, esempi di scritti di esame ed esercizi, e i manuali per le esercitazioni di laboratorio. Tutto il materiale didattico è scaricabile da un sito web o attraverso il portale.
- Atzeni, Ceri, Paraboschi, Torlone, 'Database systems', 1 ed., McGraw Hill, 1999. - Golfarelli, Rizzi, 'Data warehouse: teoria e pratica della progettazione', 2 ed., McGraw Hill, 2006. - Tan, Steinbach, Kumar, 'An introduction to data mining', Addison Wesley, 2005. Copies of the slides used during the lectures, examples of written exams and exercises, and manuals for the activities in the laboratory will be made available. All teaching material is downloadable from the course website or the Portal.
Modalità di esame: Prova scritta (in aula); Prova orale facoltativa;
Exam: Written test; Optional oral exam;
... L'esame è costituito da una prova scritta della durata di 2 ore, dalla valutazione delle relazioni sulle esercitazioni individuali assegnate durante il corso e da una prova orale. Le esercitazioni individuali e la prova orale sono facoltative. Il voto finale è definito in base alla valutazione della prova scritta ed eventualmente delle relazioni delle esercitazioni e della prova orale. Le relazioni delle esercitazioni individuali sono considerate solo se la valutazione della prova scritta è pari o superiore a 18. Il voto massimo complessivo che può essere conseguito mediante la prova scritta e la valutazione delle relazioni individuali è pari a 26. Nel caso venga sostenuta la prova orale, il voto finale è una media (approssimata) del voto della prova scritta, del voto delle relazioni individuali e del voto dell'orale. La prova scritta comprende - 2 domande a risposta chiusa relative ai principali argomenti trattati durante il corso (caratteristiche tecnologiche di un sistema per la gestione di basi di dati, linguaggio SQL, progettazione fisica di basi di dati relazionali, progettazione concettuale, logica e fisica di data warehouse, algoritmi di analisi dei dati) (max 2 punti) - 1 esercizio di progettazione fisica (max 7 punti) - 1 esercizio di progettazione di trigger (max. 8 punti) - 1 esercizio su data warehousing che include la progettazione di un data warehouse e la scrittura di interrogazioni di accesso ai dati mediante linguaggio SQL (max 13 punti) Durante la prova scritta gli studenti possono consultare libri o appunti. La valutazione degli esercizi della prova scritta si basa sulla correttezza del risultato e sull'appropriatezza delle metodologie di risoluzione applicate. La prova orale verte su tutti gli argomenti trattati nel corso (max 30 punti). Le relazioni individuali assegnate durante il corso vertono sui principali argomenti trattati durante il corso (max 2 punti).
Gli studenti e le studentesse con disabilità o con Disturbi Specifici di Apprendimento (DSA), oltre alla segnalazione tramite procedura informatizzata, sono invitati a comunicare anche direttamente al/la docente titolare dell'insegnamento, con un preavviso non inferiore ad una settimana dall'avvio della sessione d'esame, gli strumenti compensativi concordati con l'Unità Special Needs, al fine di permettere al/la docente la declinazione più idonea in riferimento alla specifica tipologia di esame.
Exam: Written test; Optional oral exam;
The exam includes a written part, the evaluation of the reports on the individual practices assigned during the course, and an oral part. The individual practices and the oral part are optional. The written part lasts 2 hours. The final score is defined by considering the evaluation of the written part, and, optionally, of the individual practices and the oral part. The individual practices are considered only if the grade of the written part is 18 or above. Without the oral part, the maximum final grade given by the written part and the evaluation of the reports on the individual practices is 26. Otherwise, the final grade is the (approximated) average computed on the grade on the written part, the evaluation of the report on the individual practices, and the grade on the oral part. The written part includes - 2 multiple choice theory questions on the main course topics (technological characteristics of a database management system, SQL language, physical database design, conceptual, logical, and physical data warehouse design, data mining algorithms) (max 2 points) - 1 exercise on physical design (max 7 points) - 1 exercise on trigger design (max 8 points) - 1 exercise on data warehousing, including the design of a data warehouse and SQL queries for data access (max 13 points) Students can use textbooks or notes during the exam. Exercises are evaluated according to the correctness of the proposed solution and to the appropriateness of the adopted resolution methodologies. The oral part includes questions on the main topics of the lectures (max 30 points). Reports on the individual practices assigned during the course are on the main topics of the lectures (max 2 points).
In addition to the message sent by the online system, students with disabilities or Specific Learning Disorders (SLD) are invited to directly inform the professor in charge of the course about the special arrangements for the exam that have been agreed with the Special Needs Unit. The professor has to be informed at least one week before the beginning of the examination session in order to provide students with the most suitable arrangements for each specific type of exam.
Esporta Word