L'insegnamento è progettato per fornire agli studenti una solida comprensione dei concetti e delle applicazioni dei modelli statistici avanzati utilizzati per analizzare dati complessi. Il corso si concentra sull'apprendimento e l'applicazione modelli lineari (Lm), modelli lineari generalizzati (GLM) e modelli lineari generalizzati misti (GLMM), nonché sui principi fondamentali dei modelli bayesiani.
Durante il corso, gli studenti acquisiranno conoscenze approfondite sulle teorie e le metodologie dei modelli statistici. Saranno introdotti ai modelli lineari, che rappresentano una classe di modelli ampiamente utilizzati per esaminare risposte continue, e in particolare gaussiane. Gli studenti impareranno a utilizzare le tecniche di stima dei minimi quadrati e le procedure di verifica delle ipotesi per adattare e interpretare i modelli lineari.
Successivamente, il corso si concentrerà sui modelli lineari generalizzati, che rappresentano una generalizzazione dei modelli lineari per variabili di risposta che seguono una distribuzione diversa dalla gaussiana. Gli studenti impareranno a utilizzare i modelli lineari generalizzati per affrontare situazioni in cui la variabile di risposta può essere binaria, categorica o di conteggio. Verranno approfonditi metodi statistici per variabili categoriche e per problemi basati su di esse, come l'analisi delle classifiche e dei ranghi, la modellizzazione dei questionari a risposta multipla e la misura dell'accordo tra valutatori.
Il corso approfondirà inoltre i modelli lineari generalizzati misti, che estendono i modelli lineari generalizzati per affrontare la presenza di dati correlati o raggruppati. Gli studenti impareranno a modellare e analizzare dati che presentano dipendenza o eterogeneità tra le unità osservate.
Infine, il corso fornirà una panoramica dei principi e delle applicazioni dei modelli bayesiani. Gli studenti impareranno i concetti chiave della statistica bayesiana, inclusa la formulazione delle distribuzioni a priori, l'applicazione della regola di Bayes per ottenere le distribuzioni a posteriori e l'interpretazione dei risultati ottenuti dai modelli bayesiani. I metodi computazionali utilizzati per l'inferenza bayesiana, come l'utilizzo delle catene di Markov Monte Carlo (MCMC), sono insegnati nell'insegnamento abbinato "Statistica computazione".
Durante l'insegnamento verranno insegnati alcuni linguaggi statistici, principalmente R.
The course is designed to provide students with a solid understanding of the concepts and applications of advanced statistical models used for analyzing complex data. The course focuses on learning and applying linear models (Lm), generalized linear models (GLM), and generalized linear mixed models (GLMM), as well as the fundamental principles of Bayesian models.
During the course, students will acquire in-depth knowledge of the theories and methodologies of statistical models. They will be introduced to linear models, which represent a widely used class of models to tackle continuous (in particular, Gaussian) responses. Students will learn how to use least squares estimation techniques and hypothesis testing procedures to fit and interpret linear models.
Subsequently, the course will concentrate on generalized linear models, which extend linear models to response variables other than normal. Students will learn to use generalized linear models to address situations where the response variable can be binary, categorical, or a count.
Particular emphasis will be put on categorical responses and on problems based on them, such as the analysis of ranks and rankings, the measurement of rater agreement and the analysis of poll data.
The course will also delve into generalized linear mixed models, which extend generalized linear models to address the presence of correlated or clustered data. Students will learn to model and analyze data that exhibit dependence or heterogeneity among the observed units.
Finally, the course will provide an overview of the principles and applications of Bayesian models. Students will learn key concepts of Bayesian statistics, including the formulation of prior distributions, the application of Bayes' rule to obtain posterior distributions, and the interpretation of results obtained from Bayesian models. Computational methods used for Bayesian inference, such as Markov Chain Monte Carlo (MCMC) techniques, are taught in the parallel course "Computational Statistics".
In this course, statistical languages will be taught; primarily R.
Al termine dell’insegnamento si chiederà allo studente di:
- acquisire una conoscenza approfondita dei concetti e delle applicazioni dei modelli statistici avanzati utilizzati per analizzare dati complessi, anche tramite l'uso di software statistico come R
- essere in grado di utilizzare le tecniche di stima dei minimi quadrati e le procedure di verifica delle ipotesi per adattare e interpretare modelli lineari per esaminare le relazioni tra variabili continue.
- essere in grado di applicare i modelli lineari generalizzati per affrontare situazioni in cui la variabile di risposta segue una distribuzione diversa dalla normale, come variabili binarie, categoriche o di conteggio.
- essere in grado di modellare e analizzare dati che presentano dipendenza o eterogeneità tra le unità osservate utilizzando modelli lineari generalizzati misti.
- comprendere la formulazione delle distribuzioni a priori, l'applicazione della regola di Bayes per ottenere le distribuzioni a posteriori e l'interpretazione dei risultati ottenuti dai modelli bayesiani.
- esserein grado di applicare le conoscenze acquisite per analizzare e interpretare dati complessi in contesti reali, come l'analisi di dati provenienti da studi clinici, sondaggi, dati finanziari o dati biologici.
- sviluppare la capacità di valutare criticamente i modelli statistici, compresi i modelli lineari, i modelli lineari generalizzati, i modelli lineari generalizzati misti e i modelli bayesiani, e di interpretare in modo accurato i risultati ottenuti.
The student will learn how to apply in practice the statistical methods s/he has studied in theory, in order to use all of their methodological potentials.
Si presume che gli studenti conoscano gli argomenti trattati dai corsi standard di matematica impartiti nei primi due anni dei corsi di ingegneria. Inoltre, è richiesta la conoscenza di concetti base di probabilità e statistica: pdf continue e discrete (e.g., distribuzione normale o di Poisson), valore atteso, varianza, covarianza (una preparazione equivalente a 15 crediti di Probabilità e Statistica Matematica.), probabilità condizionata.
Previous education equivalent to 15 credits of Probability and Mathematical Statistics.
Durante l’insegnamento verranno trattati i seguenti argomenti
- Modelli lineari
- Modelli lineari generalizzati
-Modelli lineari generalizzati misti
- Dati categorici
- Statistica Bayesiana
- software R, con cenni ad altri software
Linear models and their applications.
Generalized linear models.
Principles of clinical and biomedical experimentation.
Parametric and nonparametric survival and reliability.
Principal components
Discriminant analysis.
Introduction to Bayesian networks.
Categorical data.
R, OpenBUGS and other specialized software.
Verranno impartite lezioni e esercitazioni. Mediamente, 3 ore di lezioni a settimana più un'ora e mezza di esercitazioni. Durante le lezioni si farà uso di lucidi e note scritte a mano (su tablet). Occasionalmente si farà anche uso della lavagna. Per meglio comprendere molti dei concetti e/o modelli, si farà ricorso all'uso del computer per simulazioni o per mostrare le analisi su dataset. I linguaggi usati saranno per la maggior parte R, ma saranno fatti cenni ad altri codici.
Traditional exercise sessions will complement lectures, whereas appropriate statistical software will be used in computer lab sessions.
- Agresti A. (2015) Foundations of linear and generalized linear models. Wiley.
- Gasparini M. (2013) Modelli probabilistici e statistici. CLUT.
- Lunn D., Jackson C., Best N., Thomas A. and Spiegelhalter D. (2013) The BUGS book. A practical introduction to Bayesian Analysis. CRC Press.
- Seber, G.A.F. (1977) Linear Regression Analysis. Wiley.
https://github.com/toyo97/statistical-models-r
- An Introduction to Statistical Learning
with Applications in R
Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani
http://faculty.marshall.usc.edu/gareth-james/ISL/
- The BUGS Book: A Practical Introduction to Bayesian Analysis
by David Lunn, Chris Jackson, Nicky Best, Andrew Thomas, David Spiegelhalter. Chapman & Hall.
- Categorical Data Analysis
by Alan Agresti. Wiley
- Statistical analysis of designed experiments
by Ajit C. Tamhane. Wiley
- Foundations of Linear and Generalized Linear Models
by Alan Agresti
Slides; Libro di testo; Esercitazioni di laboratorio;
Lecture slides; Text book; Lab exercises;
Modalità di esame: Prova orale obbligatoria;
Exam: Compulsory oral exam;
...
L'obiettivo dell'esame è quello di arricchire la conoscenza del candidato sugli argomenti inseriti nel programma, la conoscenza dettagliata della matematica alla base delle tecniche apprese, i loro limiti, e di testare le capacità nell'analisi dei dati utilizzando i modelli illustrati a lezione, dimostrando di saper determinare il dominio di applicabilità delle varie tecniche rispetto alla natura dei dati.
L'esame sarà una interrogazione orale su tre parole chiave (oppure argomenti oppure script di codice) estratte a caso da un lista di argomenti consegnata agli studenti a fine corso; la discussione di ogni parola chiave varrà approssimativamente 10 punti.
Gli studenti e le studentesse con disabilità o con Disturbi Specifici di Apprendimento (DSA), oltre alla segnalazione tramite procedura informatizzata, sono invitati a comunicare anche direttamente al/la docente titolare dell'insegnamento, con un preavviso non inferiore ad una settimana dall'avvio della sessione d'esame, gli strumenti compensativi concordati con l'Unità Special Needs, al fine di permettere al/la docente la declinazione più idonea in riferimento alla specifica tipologia di esame.
Exam: Compulsory oral exam;
The exam will be an oral conversation about two out of around twenty case studies seen in class
In addition to the message sent by the online system, students with disabilities or Specific Learning Disorders (SLD) are invited to directly inform the professor in charge of the course about the special arrangements for the exam that have been agreed with the Special Needs Unit. The professor has to be informed at least one week before the beginning of the examination session in order to provide students with the most suitable arrangements for each specific type of exam.