PORTALE DELLA DIDATTICA

PORTALE DELLA DIDATTICA

PORTALE DELLA DIDATTICA

Elenco notifiche



Data Science e Tecnologie per le Basi di Dati

01SQMOV

A.A. 2020/21

Lingua dell'insegnamento

Italiano

Corsi di studio

Corso di Laurea Magistrale in Ingegneria Informatica (Computer Engineering) - Torino

Organizzazione dell'insegnamento
Didattica Ore
Lezioni 43
Esercitazioni in aula 25
Esercitazioni in laboratorio 12
Tutoraggio 60
Docenti
Docente Qualifica Settore h.Lez h.Es h.Lab h.Tut Anni incarico
Baralis Elena Maria Professore Ordinario IINF-05/A 43 20 0 15 7
Collaboratori
Espandi

Didattica
SSD CFU Attivita' formative Ambiti disciplinari
ING-INF/05
ING-INF/05
4
4
F - Altre attività (art. 10)
B - Caratterizzanti
Abilità informatiche e telematiche
Ingegneria informatica
2020/21
Insegnamento obbligatorio per la Laurea Magistrale in Ingegneria Informatica, collocato al I pd del I anno: descrive gli aspetti fondamentali della tecnologia dei sistemi per la gestione delle basi di dati e le modalità di gestione delle basi di dati destinate all'analisi dei dati (normalmente denominate data warehouse), tipicamente caratterizzate dalla necessità di gestire grandi volumi di dati. Sono considerate sia le tecniche più tradizionali di analisi OLAP (On Line Analytical Processing) dei dati, sia le analisi complesse basate su tecniche di data mining. Le attività di laboratorio permettono di valutare le caratteristiche tecnologiche dei prodotti commerciali più diffusi e di sperimentare vari strumenti per l'analisi dei dati.
The course is taught in Italian. The course, compulsory for the Master degree in Computer Engineering, is offered on the 1st semester of the 1st year. The course addresses the fundamental issues in the technology of database management systems and introduces database management techniques for data warehouses (database systems specialized in strategic decision support), typically characterized by the need of managing very large databases. Both traditional OLAP (On Line Analytical Processing) analysis techniques and complex data mining techniques will be addressed. Laboratory sessions allow experimental activities, both on technological characteristics and data analysis, on the most widespread commercial and open-source products.
- Conoscenza delle caratteristiche tecnologiche di un sistema per la gestione di basi di dati: gestione dell'accesso concorrente ai dati, affidabilità, strutture del livello fisico, ottimizzazione dell'accesso ai dati. - Capacità di eseguire la progettazione fisica di una base di dati relazionale. - Conoscenza dell'architettura delle basi di dati distribuite e della gestione della replicazione. - Conoscenza delle basi di dati attive e dei costrutti del linguaggio SQL per la definizione dei trigger. - Capacità di scrivere trigger nel linguaggio SQL. - Conoscenza dell'architettura dei sistemi per l'analisi dei dati (data warehouse) e delle metodologie di progettazione concettuale, logica e fisica di un data warehouse. - Capacità di progettare un data warehouse. - Conoscenza dei costrutti del linguaggio SQL per la formulazione di interrogazioni OLAP per data warehouse. - Capacità di scrivere interrogazioni OLAP nel linguaggio SQL. - Conoscenza dei principali algoritmi di data mining per la classificazione, il clustering e l'estrazione di regole di associazione
- Knowledge of the main technological characteristics of a database management system: concurrent data access management, reliability, physical level structures, data access optimization. - Ability to design the physical data structures for a relational database. - Knowledge of distributed database system architectures and replication management. - Knowledge of active database systems and SQL statements for trigger definition. - Ability to write triggers in the SQL language. - Knowledge of data warehouse architecture and of the methodology for conceptual, logical, and physical design of a data warehouse. - Ability to design a data warehouse. - Knowledge of the SQL statements for OLAP queries in a data warehouse. - Ability to write OLAP queries in the SQL language. - Knowledge of the major data mining algorithms for classification, clustering, and association rule mining.
Conoscenza del modello relazionale e del linguaggio SQL e competenze di base di programmazione.
Knowledge of the relational model and SQL language and basic programming skills.
Argomenti trattati nelle lezioni e relativo peso in crediti: - Caratteristiche tecnologiche di un sistema per la gestione di basi di dati: gestione dell'accesso concorrente, affidabilità, strutture del livello fisico, ottimizzazione dell'accesso (1.8 cr.) - Basi di dati attive e costrutti del linguaggio SQL per la definizione dei trigger (0.4 cr.) - Architettura delle basi di dati distribuite e gestione della replicazione (0.4 cr.) - Data warehouse: architettura, metodologie di progettazione concettuale, logica e fisica, istruzioni in linguaggio SQL per la formulazione di interrogazioni OLAP (1.4 cr.) - Algoritmi di data mining: classificazione, clustering ed estrazione di regole di associazione (1.6 cr.)
- Technological characteristics of a database management system: concurrent data access management, reliability, physical level structures, data access optimization (1.8 cr.) - Active database systems and SQL statements for trigger definition (0.4 cr.) - Distributed database system architecture and replication management (0.4 cr.) - Data warehouses: architecture, methodology for conceptual, logical, and physical design, SQL statements for OLAP queries (1.4 cr.) - Data mining algorithms: classification, clustering, and association rule mining (1.6 cr.)
Il corso comprende esercitazioni in aula inerenti gli argomenti trattati nelle lezioni, e in particolare sul linguaggio SQL, sulla progettazione fisica di basi di dati relazionali, sulla progettazione concettuale, logica e fisica di data warehouse (1.2 cr.). Gli studenti svolgeranno inoltre esercitazioni individuali durante il corso, per cui dovranno predisporre una relazione che contribuirà a determinare il voto finale. Il corso comprende esercitazioni in laboratorio sull'utilizzo del linguaggio SQL (anche per la progettazione fisica di basi di dati) e sulla progettazione di data warehouse (1.2 cr). L'attività di laboratorio permette di sperimentare l'uso dei prodotti commerciali e open-source più diffusi.
The course includes practices on the lecture topics, and in particular SQL language, physical database design, and conceptual, logical, and physical data warehouse design (1.2 cr.). Students will prepare an individual written report on exercises proposed during the course. The report will contribute to the final exam grade. The course includes laboratory sessions on the SQL language (also for database physical design) and data warehouse design (1.2 cr.). Laboratory sessions allow experimental activities on the most widespread commercial and open-source products.
I testi, scelti tra quelli elencati, saranno comunicati a lezione dal docente titolare dell'insegnamento: - Atzeni, Ceri, Fraternali, Paraboschi, Torlone, 'Basi di dati ' Architetture e linee di evoluzione', 5 ed., McGraw Hill, 2018. - Golfarelli, Rizzi, 'Data warehouse: teoria e pratica della progettazione', 2 ed., McGraw Hill, 2006. - Tan, Steinbach, Kumar, 'An introduction to data mining', 2 ed., Addison Wesley, 2005. Sono disponibili copie dei lucidi utilizzati nelle lezioni, esempi di scritti di esame ed esercizi, e i manuali per le esercitazioni di laboratorio. Tutto il materiale didattico è scaricabile da un sito web o attraverso il portale.
- Atzeni, Ceri, Paraboschi, Torlone, 'Database systems', 1 ed., McGraw Hill, 1999. - Golfarelli, Rizzi, 'Data warehouse: teoria e pratica della progettazione', 2 ed., McGraw Hill, 2006. - Tan, Steinbach, Kumar, 'An introduction to data mining', 2 ed., Addison Wesley, 2005. Copies of the slides used during the lectures, examples of written exams and exercises, and manuals for the activities in the laboratory will be made available. All teaching material is downloadable from the course website or the Portal.
Modalità di esame: Prova scritta tramite PC con l'utilizzo della piattaforma di ateneo; Elaborato progettuale individuale;
L'esame è costituito da una prova scritta e dalla valutazione delle relazioni sulle esercitazioni individuali assegnate durante il corso. Le esercitazioni individuali sono facoltative. Accertamento dei risultati di apprendimento attesi La prova scritta accerta con esercizi di progettazione - la capacità di progettare le strutture fisiche di una base di dati - la capacità di scrivere trigger nel linguaggio SQL - la capacità di progettare un data warehouse - la capacità di scrivere interrogazioni OLAP nel linguaggio SQL La prova scritta accerta con domande teoriche ed esercizi - la conoscenza degli aspetti tecnologici principali di un sistema per la gestione di basi di dati (accesso concorrente ai dati, affidabilità) - la conoscenza degli aspetti tecnologici principali delle basi di dati distribuite - la conoscenza dei principali algoritmi di data mining per la classificazione, il clustering e l'estrazione di regole di associazione Criteri, regole e procedure per l'esame L'esame è costituito da una prova scritta e dalla valutazione delle relazioni sulle esercitazioni individuali assegnate durante il corso. Le esercitazioni individuali sono facoltative. La prova scritta dura 80 minuti. Il voto finale è definito in base alla valutazione della prova scritta ed eventualmente delle relazioni delle esercitazioni. Le relazioni delle esercitazioni individuali sono considerate solo se la valutazione della prova scritta è pari o superiore a 18. La prova scritta comprende domande a risposta aperta e a risposta chiusa. Le risposte errate alle domande a risposta chiusa comportano una penalizzazione. Le risposte mancanti valgono zero. Durante la prova scritta non è possibile utilizzare libri e appunti o dispositivi elettronici di qualsiasi tipo. Struttura e argomenti della prova scritta. - 4-6 domande relative ai principali argomenti trattati durante il corso (caratteristiche tecnologiche di un sistema per la gestione di basi di dati, basi di dati distribuite, preparazione dei dati, algoritmi di analisi dei dati) (max 6 punti) - 1-3 esercizi di progettazione fisica (max 5 punti) - 1-2 esercizi di progettazione di trigger (max. 9 punti) - 1-3 esercizi di progettazione di data warehouse (max. 3 punti) - 2-3 esercizi di progettazione di istruzioni SQL per l'accesso ai dati di un data warehouse (max. 8 punti) Il punteggio di ogni domanda sarà specificato nel testo della domanda. La valutazione degli esercizi della prova scritta si basa sulla correttezza del risultato e sull'appropriatezza delle metodologie di risoluzione applicate. Le relazioni individuali facoltative sono assegnate e devono essere consegnate a scadenze prestabilite durante il corso. Vertono sui principali argomenti trattati durante il corso (max 2 punti).
Exam: Computer-based written test using the PoliTo platform; Individual project;
The exam includes a written part and the evaluation of reports on individual exercises assigned during the course. The individual exercises are optional. Learning objectives assessment The written part will assess by means of design exercises - the ability to design the physical structure of a database - the ability to write triggers in the SQL language - the ability to design a data warehouse - the ability to write OLAP queries in the SQL language The written part will assess by means of theory questions and exercises - the knowledge of the main technological characteristics of a database management system (concurrent data access, reliability) - the knowledge of the main technological characteristics of distributed database systems - the knowledge of the major data mining algorithms for classification, clustering, and association rule mining. Exam structure and grading criteria The exam includes a written part and the evaluation of reports on individual practices assigned during the course. The individual practices are optional. The written part lasts 80 minutes. The final score is defined by considering the evaluation of the written part, and, optionally, of the individual practices. The individual practices are considered only if the grade of the written part is 18 or above. The written part includes box-to-fill and multiple choice questions. For multiple choice questions, wrong answers are penalized. Missing answers are evaluated zero. Textbooks, notes, electronic devices of any kind are not allowed. Structure and topics of the written part. - 4-6 questions on the main topics of the course (technological characteristics of a database management system, distributed database systems, data preparation, data analytics algorithms) (max 6 points) - 1-3 exercises on physical design (max 5 points) - 1-2 exercises on trigger design (max. 9 points) - 1-3 exercises on data warehouse design (max. 3 points) - 2-3 exercises on SQL queries for data access in a data warehouse (max. 8 points) The score of each question will be specified in the exam text. Exercises are evaluated according to the correctness of the proposed solution and to the appropriateness of the adopted resolution methodologies. Reports on the individual practices are assigned and must be delivered at predefined deadlines during the course. They deal with the main topics of the lectures (max 2 points).
Modalità di esame: Test informatizzato in laboratorio; Prova scritta tramite PC con l'utilizzo della piattaforma di ateneo; Elaborato progettuale individuale;
L'esame è costituito da una prova scritta e dalla valutazione delle relazioni sulle esercitazioni individuali assegnate durante il corso. Le esercitazioni individuali sono facoltative. Accertamento dei risultati di apprendimento attesi La prova scritta accerta con esercizi di progettazione - la capacità di progettare le strutture fisiche di una base di dati - la capacità di scrivere trigger nel linguaggio SQL - la capacità di progettare un data warehouse - la capacità di scrivere interrogazioni OLAP nel linguaggio SQL La prova scritta accerta con domande teoriche ed esercizi - la conoscenza degli aspetti tecnologici principali di un sistema per la gestione di basi di dati (accesso concorrente ai dati, affidabilità) - la conoscenza degli aspetti tecnologici principali delle basi di dati distribuite - la conoscenza dei principali algoritmi di data mining per la classificazione, il clustering e l'estrazione di regole di associazione Criteri, regole e procedure per l'esame L'esame è costituito da una prova scritta e dalla valutazione delle relazioni sulle esercitazioni individuali assegnate durante il corso. Le esercitazioni individuali sono facoltative. La prova scritta dura 80 minuti. Il voto finale è definito in base alla valutazione della prova scritta ed eventualmente delle relazioni delle esercitazioni. Le relazioni delle esercitazioni individuali sono considerate solo se la valutazione della prova scritta è pari o superiore a 18. La prova scritta comprende domande a risposta aperta e a risposta chiusa. Le risposte errate alle domande a risposta chiusa comportano una penalizzazione. Le risposte mancanti valgono zero. Durante la prova scritta non è possibile utilizzare libri e appunti o dispositivi elettronici di qualsiasi tipo. Struttura e argomenti della prova scritta. - 4-6 domande relative ai principali argomenti trattati durante il corso (caratteristiche tecnologiche di un sistema per la gestione di basi di dati, basi di dati distribuite, preparazione dei dati, algoritmi di analisi dei dati) (max 6 punti) - 1-3 esercizi di progettazione fisica (max 5 punti) - 1-2 esercizi di progettazione di trigger (max. 9 punti) - 1-3 esercizi di progettazione di data warehouse (max. 3 punti) - 2-3 esercizi di progettazione di istruzioni SQL per l'accesso ai dati di un data warehouse (max. 8 punti) Il punteggio di ogni domanda sarà specificato nel testo della domanda. La valutazione degli esercizi della prova scritta si basa sulla correttezza del risultato e sull'appropriatezza delle metodologie di risoluzione applicate. Le relazioni individuali facoltative sono assegnate e devono essere consegnate a scadenze prestabilite durante il corso. Vertono sui principali argomenti trattati durante il corso (max 2 punti).
Exam: Computer lab-based test; Computer-based written test using the PoliTo platform; Individual project;
The exam includes a written part and the evaluation of reports on individual exercises assigned during the course. The individual exercises are optional. Learning objectives assessment The written part will assess by means of design exercises - the ability to design the physical structure of a database - the ability to write triggers in the SQL language - the ability to design a data warehouse - the ability to write OLAP queries in the SQL language The written part will assess by means of theory questions and exercises - the knowledge of the main technological characteristics of a database management system (concurrent data access, reliability) - the knowledge of the main technological characteristics of distributed database systems - the knowledge of the major data mining algorithms for classification, clustering, and association rule mining. Exam structure and grading criteria The exam includes a written part and the evaluation of reports on individual practices assigned during the course. The individual practices are optional. The written part lasts 80 minutes. The final score is defined by considering the evaluation of the written part, and, optionally, of the individual practices. The individual practices are considered only if the grade of the written part is 18 or above. The written part includes box-to-fill and multiple choice questions. For multiple choice questions, wrong answers are penalized. Missing answers are evaluated zero. Textbooks, notes, electronic devices of any kind are not allowed. Structure and topics of the written part. - 4-6 questions on the main topics of the course (technological characteristics of a database management system, distributed database systems, data preparation, data analytics algorithms) (max 6 points) - 1-3 exercises on physical design (max 5 points) - 1-2 exercises on trigger design (max. 9 points) - 1-3 exercises on data warehouse design (max. 3 points) - 2-3 exercises on SQL queries for data access in a data warehouse (max. 8 points) The score of each question will be specified in the exam text. Exercises are evaluated according to the correctness of the proposed solution and to the appropriateness of the adopted resolution methodologies. Reports on the individual practices are assigned and must be delivered at predefined deadlines during the course. They deal with the main topics of the lectures (max 2 points).
Esporta Word