PORTALE DELLA DIDATTICA

PORTALE DELLA DIDATTICA

PORTALE DELLA DIDATTICA

Elenco notifiche



Data analytics for science and society

01SCVIU

A.A. 2020/21

Course Language

Inglese

Degree programme(s)

Doctorate Research in Ingegneria Informatica E Dei Sistemi - Torino

Course structure
Teaching Hours
Lezioni 15
Lecturers
Teacher Status SSD h.Les h.Ex h.Lab h.Tut Years teaching
Chiusano Silvia Anna Professore Ordinario IINF-05/A 9 0 0 0 2
Co-lectures
Espandi

Context
SSD CFU Activities Area context
*** N/A ***    
L'uso delle tecnologie dell'informazione e della comunicazione ha attualmente reso disponibile un'enorme quantità di dati eterogenei in vari domini di applicazioni reali (ad esempio, urban computing, analisi di dati clinici e genetici, analisi delle abitudini). Poichè l'estrazione della conoscenza da queste grandi quantità di dati può portare alla luce un ricco spettro di conoscenze rilevanti nel dominio specifico, vi è una grande necessità di aumentare la capacità di analisi dei dati in varie comunità di ricerca. Tuttavia, l'analisi dei dati su raccolte di dati reali è ancora molto complesso, perché sorgono varie sfide sulla scienza dei dati che riguardano la raccolta, la memorizzazione, la condivisione, la modellazione, l'analisi e la visualizzazione di informazioni e conoscenza. Inoltre, poiché gli algoritmi di analisi sono strumenti efficaci e necessari alla base di gran parte delle informazioni che utilizziamo ogni giorno, renderli più trasparenti dovrebbe migliorarne l'usabilità in varie aree applicative. Il corso discute alcuni casi di studio reali di analisi per illustrare come progettare, sviluppare e testare un progetto di analisi dei dati. Ciò avverrà attraverso la discussione degli aspetti critici che caratterizzano un progetto di analisi dei dati e la presentazione degli ultimi progressi nell'area delle applicazioni di analisi con un'attenzione particolare al modo in cui sono state progettate e sviluppate soluzioni all'avanguardia per ottenere informazioni utili e interpretabili. Una panoramica delle soluzioni e delle tecnologie di analisi dei dati sarà discussa congiuntamente ai casi d'uso reale in cui questi approcci sono essenziali. L'obiettivo di questo corso di dottorato di ricerca è presentare come sfruttare le tecnologie di analisi dei dati nelle proprie attività di ricerca per estrarre conoscenze fruibili. Gli studenti di dottorato possono comprendere le diverse fasi in cui è strutturato il progetto di analisi dei dati, quali sono le criticità che si presentano e come possono essere affrontate. Questo corso fa parte di un percorso formativo sulla Data Science. Il percorso è composto da - un corso introduttivo (Data Mining: Concepts and Algorithms), che copre i fondamenti dell'analisi dei dati, che è un prerequisito culturale per gli altri corsi - 5 corsi tematici che trattano in modo approfondito argomenti specifici di Data Science, come diversi tipi di algoritmi di domini applicativi: - Analisi dei dati per la scienza e la società - Machine Learning per il riconoscimento dei modelli - Apprendimento mimetico - Estrazione di testo e analisi - Tecnologie di visualizzazione e Visual Analytics nelle proprie attività di ricerca per estrarre conoscenze utili. Ph.D. gli studenti possono comprendere le diverse fasi in cui è strutturato il progetto di analisi dei dati, quali sono le criticità che si presentano e come possono essere affrontate.
The use of Information and Communication Technologies has currently made available a huge amount of heterogeneous data in various real application domains (e.g., in the domain of urban computing, medical analytics, behavioral analytics). As deeply digging these large amounts of collected data can unearth a rich spectrum of knowledge in the targeted domain, there is a great need to increase data-analytics capability in various communities. However, data analytics on real data collections is still a daunting task, because various challenges about data science arise dealing with the collection, storage, search, sharing, modeling, analysis, and visualization of data, information, and knowledge. Furthermore, since analytics algorithms are powerful and necessary tools behind a large part of the information we use every day, rendering them more transparent should improve their usability in various areas. The course discusses a sample of real analytics case studies to illustrate how to design, develop, and test a data analytics project. This will be done through discussing critical issues that arise in a data analytics project and presenting the latest advancements in the area of analytics applications with a special focus on how cutting-edge solutions have been designed and developed to gain useful and interpretable insights. An overview of the data analytics solutions and technologies will be thoroughly discussed together with real-life use cases in which these approaches are essential. The objective of this course is that Ph.D. students learn by real analytics projects on how to exploit data analytics technologies in their own research activities to mine useful knowledge. Ph.D. students can understand the different phases in which the data analytics project is structured, which are the critical issues that arise, and how they can be addressed. This course belongs to an educational path on Data Science. The path is composed by - an introductory course (Data Mining: Concepts and Algorithms), covering data analytics fundamentals, which is a cultural prerequisite for the other courses - 5 thematic courses dealing in-depth with specific Data Science topics, such as different algorithm types of application domains: -- Data Analytics for Science and Society -- Machine Learning for Pattern Recognition -- Mimetic Learning -- Text Mining and Analytics -- Visualization and Visual Analytics technologies in their own research activities to mine useful knowledge. Ph.D. students can understand the different phases in which the data analytics project is structured, which are the critical issues that arise, and how they can be addressed. This course belongs to an educational path on Data Science. The path is composed by - an introductory course (Data Mining: Concepts and Algorithms), covering data analytics fundamentals, which is a cultural prerequisite for the other courses - 5 thematic courses dealing in-depth with specific Data Science topics, such as different algorithm types of application domains: -- Data Analytics for Science and Society -- Machine Learning for Pattern Recognition -- Mimetic Learning -- Text Mining and Analytics -- Visualization and Visual Analytics
Concetti di base del data mining
Data mining: basics concepts
Questo corso illustra le diverse fasi del processo di data mining con particolare attenzione alle fasi della raccolta, integrazione, gestione e analisi dei dati. Attraverso una serie di studi di casi di riferimento, il corso illustra le criticità che emergono nelle fasi precedenti e le soluzioni tecnologicamente avanzate progettate e sviluppate per poterle affrontare. I progetti di analisi dei dati richiedono l’analisi di vaste collezioni di dati eterogenei. Con riferimento ai casi di studio considerati, nel corso saranno discusse le tecniche di integrazione dei dati e i paradigmi di rappresentazione dei dati per una rappresentazione unificata di collezioni di dati eterogenei che descriva tutte le caratteristiche del contesto considerato. Inoltre, nell’ambito dei casi di studio saranno analizzati i possibili utilizzi della vasta collezione di algoritmi di data mining, tra cui tecniche supervisionate, non supervisionate, ed esplorative. Esempi di casi di studio provenienti dai seguenti domini saranno esaminati nel corso: - applicazioni mediche (ad esempio, analisi di dati clinici e fisiologici) - applicazioni energetiche - social networks (ad esempio, analisi dei dati tweet) - applicazioni in contesto urbano
This course illustrates the different phases of the data mining process with particular emphasis on the phases of data collection, data fusion, data management, and data analytics. Through a set of reference case studies, the course discusses the critical issues arising in the above phases and the cutting-edge solutions that have been designed and developed to address them. Data analytics projects usually require to deal with a large amount of heterogeneous data collections. Data fusion techniques and data representation paradigms are discussed to integrate the heterogeneous collected data into a unified representation describing all facets of the targeted domain. Moreover, the exploitation of the vast collection of data mining algorithms in the considered cases, including supervised, unsupervised, and exploratory data mining techniques, is discussed. Case studies coming from the following real-life analytics domains will be investigated in the course: - Medical domain (e.g., mining clinical and physiological data) - Energy informatics - Social dynamics (e.g., tweet data analysis) - Urban computing (e.g., mining urban data)
A distanza in modalità sincrona
On line synchronous mode
Prova di laboratorio di natura pratica sperimentale o informatico
Laborartory test on experimental practice or informatics
P.D.2-2 - Giugno
P.D.2-2 - June