I metodi data-driven che utilizzano la potenza di calcolo per analizzare dati provenienti da esperimenti o simulazioni stanno diventando sempre pił importanti nella ricerca scientifica. Nella scienza dei materiali, questi approcci possono aiutare a scoprire pattern, prevederne le proprietą e guidare il design e la progettazione di nuovi tipi di materiali.
Questo corso č progettato per fornire agli studenti un background sulle metodologie data-driven che possono essere utili nella scienza dei materiali. Gli studenti impareranno a elaborare e analizzare dati provenienti da esperimenti e da simulazioni utilizzando vari approcci computazionali e di machine learning.
Il corso si propone di introdurre gli studenti a metodi statistici e data-driven di base e avanzati, utili alla ricerca sia sperimentale che computazionale.
Oltre ai concetti fondamentali per l'analisi di dati acquisiti sperimentalmente, il corso fornirą anche conoscenze di base per estrarre dati da simulazioni e modellazione di materiali su varie scale. Un'enfasi significativa sarą posta sulle moderne metodologie che coinvolgono il machine learning (ML) e l'intelligenza artificiale (AI) per materials discovery e materials design.
Il corso includerą una sostanziale componente pratica, che consentirą agli studenti di apprendere e applicare direttamente questi metodi di analisi avanzata per lo studio di dataset (ad esempio, ottenuti nel corso di attivitą e progetti di ricerca).
Obiettivi:
- Acquisire conoscenze statistiche fondamentali dell'analisi dei dati.
- Apprendere i fondamenti del machine learning e dell'intelligenza artificiale.
- Apprendere i principi di base della scienza dei materiali computazionale e della simulazione dei materiali su varie scale.
- Acquisire competenze di base nell'analisi avanzata di dataset sperimentali e da simulazioni.
- Applicare i metodi data-driven all'analisi di dataset reali/sperimentali di scienza dei materiali, acquisendo esperienza pratica con gli strumenti computazionali e i software utilizzati nell'analisi dei dati.
- Utilizzare e implementare modelli di apprendimento automatico e tecniche di IA per risolvere problemi pratici di scienza dei materiali.
Data-driven methods that use computer power to analyze data collected from experiments or simulations are becoming increasingly important in scientific research.
In materials science, such approaches can help to discover patterns, to predict materials' properties, and to guide the rational design and engineering of new types of materials.
This course is designed to provide students with a background on data-driven methodologies that can be useful in materials science.
Students will learn to process and analyze data coming from experiments and/or simulations using various types of computational and machine-learning approaches.
The course aims to introduce students to basic and advanced statistical and data-driven methods useful in experimental and computational research.
In addition to the fundamental concepts necessary to analyze experimentally acquired data, the course will also provide basic knowledge for extracting data from simulations and models of materials at various scales (synthetic datasets).
Significant emphasis will be placed on modern methodologies involving machine learning (ML) and artificial intelligence (AI) for materials discovery and design.
The course will include a substantial component of hands-on practice, which will enable students to learn and directly apply these advanced analysis methods to the study of datasets (e.g., obtained in the course of practical research activities and projects).
Objectives:
- Acquire fundamental knowledge and notions of statistical data analysis.
- Learn fundamentals of machine learning and artificial intelligence.
- Learn basic principles of computational materials science and materials simulation and modeling at various scales.
- Acquire basic skills in advanced analysis of experimental and synthetic datasets.
- Apply data-driven methods to the analysis of real/experimental materials science datasets, gaining hands-on experience with computational tools and software used in data analysis.
- Use and implement machine learning models and AI techniques to solve real materials science problems.
Basi di scienza dei materiali
Basics of materials science
1. Introduzione 1: analisi dei dati su vari tipi di dataset (sperimentali, sintetici, ecc.)
2. Introduzione 2: nozioni di base sui metodi statistici basati sui dati utili per la scienza dei materiali (panoramica, definizioni, importanza e impatto, ecc.).
3. Principi della scienza dei materiali computazionale e della simulazione dei materiali (metodi quantomeccanici, approcci di simulazione multiscala, casi studio e applicazioni).
4. Fondamenti di Machine Learning (introduzione al machine learning, apprendimento supervised e unsupervised, algoritmi chiave e loro applicazioni nella scienza dei materiali).
5. Descrittori per l'analisi dei materiali (definizioni, importanza, panoramica dei descrittori pił comuni, metodi per generare descrittori da dati di simulazione e risultati sperimentali, casi studio ed esempi pratici).
6. Fondamenti di tecniche avanzate di machine learning per lo studio e la caratterizzazione dei materiali (deep learning, reti neurali, ecc.).
7. Nozioni di base sulle metodologie di IA per la scoperta e la progettazione dei materiali (modelli generativi, previsione delle proprietą dei materiali mediante ML/AI, casi di studio e storie di successo).
8. Best practice nella ricerca data-driven (acquisizione di dati da simulazioni ed esperimenti, pre-elaborazione e pulizia dei dati, gestione di grandi dataset, conservazione, riproducibilitą, ruolo dei risultati negativi, ecc.)
9. Applicazione pratica dei metodi data-driven (dataset reali, dataset propri, progetto di gruppo, ecc.)
1. Introduction 1: data analysis on various types of datasets (experimental, synthetic, etc.)
2. Introduction 2: basics of data-driven statistical methods useful for materials science (overview, definitions, importance and impact, etc.).
3. Principles of computational material science and materials simulation (quantum mechanical methods, multiscale simulation approaches, case studies and applications).
4. Machine Learning fundamentals (introduction to machine learning, supervised and unsupervised learning, key algorithms and their applications in material science).
5. Descriptors for materials analysis (definitions, importance, overview of common descriptors, methods for generating descriptors from simulation data and experimental result, case studies and practical examples)
6. Basics of advanced machine learning techniques for the study and characterization of materials (deep learning, neural networks, etc.).
7. Basics of AI methodologies for material discovery and materials design (generative models, prediction of material properties using ML/AI, case studies and success stories).
8. Best practices in data-driven research (data acquisition from simulations and experiments, data preprocessing and cleaning, managing large datasets, preservation, reproducibility, role of negative results, etc.).
9. Hands-on application of data-driven methods (real-world datasets, own datasets, group project, etc.).