Il corso presenta in maniera pratica l’approccio del “Design of Experiment” (o “Experimental design”, disegno sperimentale), cioè della metodologia scientifica e statistica utilizzata per pianificare e condurre esperimenti in modo efficiente e informativo. Il corso sarà improntato ad un metodo didattico estremamente pratico, basato su esempi reali. Gli aspetti più strettamente matematici e formali saranno trattati col medesimo metodo, al fine di trasmettere il reale potenziale delle tecniche insegnate nel corso.
The course presents in a practical manner the approach of "Design of Experiment" (or "Experimental design"), which is the scientific and statistical methodology used to plan and conduct experiments efficiently and informatively. The course will be based on an extremely practical teaching method, with many real examples. The more mathematically and formally oriented aspects will be addressed with the same approach, to convey the real potential of the techniques taught in the course.
Analisi matematica, Excel, fondamenti di algebra lineare e basi di MATLAB consigliati
Mathematical analysis, Excel, fundaments of linear algebra and MATLAB basics suggested
Il corso è costituito da una parte teorica con lezioni frontali, e da una parte pratica fortemente focalizzata sul problem solving. Nella parte pratica, gli studenti potranno mettersi alla prova lavorando su dataset da studiare secondo le metodologie DoE esposte durante il corso. L’utilizzo di casi reali dei partecipanti è fortemente incoraggiato.
Le esercitazioni saranno eseguite principalmente sul software open source Chemometric Agile Tool (CAT, http://www.gruppochemiometria.it/index.php/software/19-download-the-r-based-chemometric-software), con alcune parti di visualizzazione su MATLAB.
Di seguito i tre (+ uno) moduli del corso:
1) DoE: Introduction. Cosa è il Design of Experiments? Panoramica dell’argomento e confronto diretto con le esigenze sperimentali dei/delle partecipanti. Introduzione della terminologia (fattori, livelli, dominio sperimentale, interazioni), panoramica dei disegni sperimentali, i diversi livelli di analisi (esplorazione, screening, ottimizzazione), perché in generale il DoE è migliore rispetto a variare un fattore alla volta.
2) DoE in practice: From screening to optimization. Questo modulo è il cuore del corso. Partiremo dalla postulazione del modello di regressione mediante multilinear regression (MLR) per modellare la risposta in relazione al design scelto. Attraverso due esercizi pratici con design full factorial interpreteremo i modelli MLR (matrice di dispersione, leverage, VIF, coefficienti, superfici di risposta, intervalli di confidenza) e faremo la predizione di nuovi esperimenti.
3) DoE in practice: D-Optimal Design. Approfondimento sul metodo del D-Optimal, come funziona, quando si utilizza, come si esegue in pratica sul software CAT. Oltre all’utilizzo classico per la selezione di sub-set da una lista (solitamente troppo lunga) di possibili esperimenti vedremo l’impiego del D-Optimal anche per la selezione di esperimenti da domini sperimentali irregolari, per l’espansione a posteriori del dominio sperimentale, e per il campionamento da liste di oggetti.
4) Practical Basics of Statistics: questo modulo tratterà i concetti di distribuzione statistica, probabilità, varianza, deviazione standard, test statistici (F-test e t-test), regressione lineare e linearità. Il modulo è inteso come un distillato di statistica a cui faremo riferimento durante lo svolgimento degli altri moduli al fine di comprendere puntualmente perché un determinato strumento statistico sia necessario, quale sia il suo significato e come lo si utilizzi.
ATTENZIONE: per una trattazione più ampia delle tecniche di analisi dati (detta anche “chemiometria”) vi rimandiamo al corso complementare di III livello di Chemiometria (“Principles of Chemometrics”), tenuto dagli stessi docenti (Cavallini e Savorani).
I due corsi non hanno una priorità temporale e possono essere seguiti nell'ordine più confacente allo studente.
The course consists of a theoretical part with lectures, and a practical part strongly focused on problem-solving. In the practical portion, students will have the opportunity to test themselves by working with datasets to study according to the DoE methodologies presented during the course. The use of participants' real-life cases is strongly encouraged.
The exercises will mainly be performed on the open-source software Chemometric Agile Tool (CAT, http://www.gruppochemiometria.it/index.php/software/19-download-the-r-based-chemometric-software), with some parts of visualization in MATLAB.
Below are the three (+ one) modules of the course:
1) DoE – Introduction: What is Design of Experiments? Overview of the topic and direct comparison with the experimental needs of the participants. Introduction of terminology (factors, levels, experimental domain, interactions), overview of experimental designs, different levels of analysis (exploration, screening, optimization), and why DoE is generally better than varying one factor at a time.
2) DoE in practice: From screening to optimization. This module is the core of the course. We will start with the postulation of the regression model using multiple linear regression (MLR) to model the response in relation to the chosen design. Through two practical exercises with full factorial design, we will interpret MLR models (dispersion matrix, leverage, VIF, coefficients, response surfaces, confidence intervals) and make predictions for new experiments.
3) DoE in practice: D-Optimal Design. In-depth examination of the D-Optimal method, how it works, when to use it, and how to practically execute it using the CAT software. In addition to the classic use for selecting sub-sets from a (usually too long) list of possible experiments, we will also see the application of D-Optimal for selecting experiments from irregular experimental domains, for the post-expansion of the experimental domain, and for sampling from lists of objects.
4) Practical Basics of Statistics: This module will cover the concepts of statistical distribution, probability, variance, standard deviation, statistical tests (F-test and t-test), linear regression, and linearity. The module is intended as a distillation of statistics to which we will refer during the other modules in order to precisely understand why a particular statistical tool is necessary, what its significance is, and how to use it.
NOTE: For a broader discussion of data analysis techniques (also known as “chemometrics”), we refer you to the complementary III level course in Chemometrics (“Principles of Chemometrics”), taught by the same instructors (Cavallini and Savorani).
The two courses do not have a temporal priority and can be taken in the order that best suits the student.
In presenza
On site
Presentazione orale - Sviluppo di project work in team