PORTALE DELLA DIDATTICA

PORTALE DELLA DIDATTICA

PORTALE DELLA DIDATTICA

Elenco notifiche



Data mining concepts and algorithms

01QTEIU

A.A. 2024/25

Course Language

Inglese

Degree programme(s)

Doctorate Research in Ingegneria Informatica E Dei Sistemi - Torino

Course structure
Teaching Hours
Lezioni 20
Lecturers
Teacher Status SSD h.Les h.Ex h.Lab h.Tut Years teaching
Giobergia Flavio   Ricercatore L240/10 IINF-05/A 14 0 0 0 1
Co-lectures
Espandi

Context
SSD CFU Activities Area context
*** N/A ***    
La disponibilità di enormi quantità di dati eterogenei nei più diversi domini applicativi evidenzia la necessità di nuove tecniche per la gestione delle informazioni, che dovrebbero consentire l'estrazione di informazioni rilevanti e utilizzabili dai dati disponibili. Il corso fornirà un'introduzione alle più diffuse tecniche di data mining e descriverà alcune implementazioni algoritmiche delle più rilevanti tecniche di analisi. Inoltre, il corso presenterà brevemente le tendenze e le tecniche più recenti per analizzare enormi quantità di dati mediante soluzioni big data e tecniche di deep learning.
The availability of huge amounts of heterogeneous data in the most diverse application domains highlights the need of new techniques for information management, which should allow the extraction of relevant and actionable information from available data. The course will provide an introduction to the most widespread data mining techniques and will describe some algorithmic implementation of the most relevant analysis techniques. Moreover, the course will briefly present the most recent trends and techniques to analyze huge amount of data by means of big data solutions, and deep learning techniques.
Nessun requisito specifico
No specific prerequisites
o Introduzione alla scienza dei dati • Data science, data mining e machine learning • Obiettivi ed esempi di data mining • Introduzione alla pipeline per Knowledge Discovery from Data (KDD) • Selezione dei dati • Pre-elaborazione dei dati • Campionamento • Estrazione e selezione di features • Discretizzazione e normalizzazione o Regole dell'associazione • Introduzione alle regole dell'associazione • Obiettivi ed esempi delle regole di associazione • Algoritmi di estrazione • Rilevanza e valutazione della qualità delle regole o Supervised Machine Learning - Classificazione • Introduzione alla classificazione • Obiettivi ed esempi di classificazione • Alberi decisionali • Foresta casuale • Classificazione bayesiana • SVM • Reti neurali • Validazione classificatore • Metriche di qualità del classificatore o Unsupervised Machine Learning - Clustering • Introduzione al clustering • Obiettivi ed esempi di clustering • Misure e problemi di distanza • Metodi partizionali • Metodi gerarchici • Metodi basati sulla densità • Valutazione sperimentale di algoritmi • Metriche di qualità del clustering o Tendenze e tecniche attuali nella scienza dei dati • Introduzione ai big data • Obiettivi ed esempi di big data • Introduzione ai framework di big data • Introduzione all'apprendimento profondo • Obiettivi ed esempi di apprendimento profondo • Introduzione ai framework di deep learning
o Introduction to data science • Data science, data mining and machine learning • Data mining goals and examples • Introduction to the pipeline for Knowledge Discovery from Data (KDD) • Data Selection • Data Preprocessing • Sampling • Feature Extraction and Selection • Discretization and Normalization o Association rules • Introduction to association rules • Association rules goals, and examples • Extraction algorithms • Relevance and quality evaluation of the association rules o Supervised Machine Learning - Classification • Introduction to classification • Classification goals and examples • Decision trees • Random Forest • Bayesian classification • SVM • Neural networks • Classifier validation • Classifier quality metrics o Unsupervised Machine Learning - Clustering • Introduction to clustering • Clustering goals and examples • Distance measures and problems • Partitional methods • Hierarchical methods • Density-based methods • Experimental evaluation of algorithms • Clustering quality metrics o Current trends and techniques in data science • Introduction to big data • Big data goals and examples • Introduction to big data frameworks • Introduction to deep learning • Deep learning goals and examples • Introduction to deep learning frameworks
Modalità mista
Mixed mode
Presentazione orale - Presentazione report scritto - Prova di laboratorio di natura pratica sperimentale o informatico
Oral presentation - Written report presentation - Laborartory test on experimental practice or informatics
P.D.1-1 - Febbraio
P.D.1-1 - February