Modelli statistici/Statistica computazionale (Modelli statistici)
L'insegnamento è progettato per fornire agli studenti una solida comprensione dei concetti e delle applicazioni dei modelli statistici avanzati utilizzati per analizzare dati complessi. Il corso si concentra sull'apprendimento e l'applicazione modelli lineari (Lm), modelli lineari generalizzati (GLM) e modelli lineari generalizzati misti (GLMM), nonché sui principi fondamentali e le tecniche, anche altamente computazionali, della statistica bayesiana. Durante il corso, gli studenti acquisiranno conoscenze approfondite sulle teorie e le metodologie dei modelli statistici. Saranno introdotti ai modelli lineari, che rappresentano una classe di modelli ampiamente utilizzati per esaminare risposte continue, e in particolare gaussiane. Gli studenti impareranno a utilizzare le tecniche di stima dei minimi quadrati e le procedure di verifica delle ipotesi per adattare e interpretare i modelli lineari. Successivamente, il corso si concentrerà sui modelli lineari generalizzati, che rappresentano una generalizzazione dei modelli lineari per variabili di risposta che seguono una distribuzione diversa dalla gaussiana. Gli studenti impareranno a utilizzare i modelli lineari generalizzati per affrontare situazioni in cui la variabile di risposta può essere binaria, categorica o di conteggio. Verranno approfonditi metodi statistici per variabili categoriche e per problemi basati su di esse, come l'analisi delle classifiche e dei ranghi, la modellizzazione dei questionari a risposta multipla e la misura dell'accordo tra valutatori. Il corso approfondirà inoltre i modelli lineari generalizzati misti, che estendono i modelli lineari generalizzati per affrontare la presenza di dati correlati o raggruppati. Gli studenti impareranno a modellare e analizzare dati che presentano dipendenza o eterogeneità tra le unità osservate. Infine, il corso fornirà una panoramica dei principi e delle applicazioni dei modelli bayesiani. Gli studenti impareranno i concetti chiave della statistica bayesiana, inclusa la formulazione delle distribuzioni a priori, l'applicazione della regola di Bayes per ottenere le distribuzioni a posteriori e l'interpretazione dei risultati ottenuti dai modelli bayesiani. I metodi computazionali utilizzati per l'inferenza bayesiana, come l'utilizzo delle catene di Markov Monte Carlo (MCMC), sono solo abbozzati in questo corso, ma sono approfonditi nell'insegnamento abbinato "Statistica computazione". Durante l'insegnamento verranno insegnati alcuni linguaggi statistici, principalmente R.
Modelli statistici/Statistica computazionale (Statistica computazionale)
L'analisi dei dati, in particolare quando si lavora con i Big Data e con dati caratterizzati da dipendenze strutturate, richiede una profonda comprensione del meccanismo generativo dei dati, delle fonti di rumore e delle variabili confondenti. Per questo motivo, la capacità di formalizzare un modello che descriva accuratamente le relazioni tra variabili osservate e variabili/processi latenti, e di implementare un algoritmo di stima nel contesto appropriato, è fondamentale per chi intende lavorare nel campo dell'analisi dei dati, sia come statistico sia come data scientist. L'insegnamento della Statistica Computazionale mira a fornire le basi teoriche e pratiche necessarie per affrontare problemi complessi di analisi dei dati mediante strumenti computazionali avanzati. Il corso permette di acquisire conoscenze che ampliano e rafforzano quelle ottenute nei programmi di laurea triennale, migliorando la comprensione dei metodi e delle tecniche avanzate utilizzate nella statistica inferenziale e computazionale. Inoltre, il corso fornisce gli strumenti necessari per applicare le conoscenze acquisite in contesti pratici, progettare e implementare soluzioni a problemi statistici reali, e formulare ipotesi su informazioni incomplete o limitate.
Modelli statistici/Statistica computazionale (Modelli statistici)
The course is designed to provide students with a solid understanding of the concepts and applications of advanced statistical models used for analyzing complex data. The course focuses on learning and applying linear models (Lm), generalized linear models (GLM), and generalized linear mixed models (GLMM), as well as the fundamental principles of Bayesian Statistics. During the course, students will acquire in-depth knowledge of the theories and methodologies of statistical models. They will be introduced to linear models, which represent a widely used class of models to tackle continuous (in particular, Gaussian) responses. Students will learn how to use least squares estimation techniques and hypothesis testing procedures to fit and interpret linear models. Subsequently, the course will concentrate on generalized linear models, which extend linear models to response variables other than normal. Students will learn to use generalized linear models to address situations where the response variable can be binary, categorical, or a count. Particular emphasis will be put on categorical responses and on problems based on them, such as the analysis of ranks and rankings, the measurement of rater agreement and the analysis of poll data. The course will also delve into generalized linear mixed models, which extend generalized linear models to address the presence of correlated or clustered data. Students will learn to model and analyze data that exhibit dependence or heterogeneity among the observed units. Finally, the course will provide an overview of the principles and applications of Bayesian models. Students will learn key concepts of Bayesian statistics, including the formulation of prior distributions, the application of Bayes' rule to obtain posterior distributions, and the interpretation of results obtained from Bayesian models. Computational methods used for Bayesian inference, such as Markov Chain Monte Carlo (MCMC) techniques, are mentioned here and taught more in depth in the parallel course "Computational Statistics". In this course, statistical languages will be taught; primarily R.
Modelli statistici/Statistica computazionale (Statistica computazionale)
Data analysis, particularly when working with Big Data and data characterized by structured dependencies, requires a deep understanding of the generative mechanism of the data, the sources of noise, and confounding variables. For this reason, the ability to formalize a model that accurately describes the relationships between observed variables and latent variables/processes, and to implement an estimation algorithm in the appropriate context, is fundamental for those intending to work in the field of data analysis, whether as a statistician or a data scientist. The teaching of Computational Statistics aims to provide the theoretical and practical foundations necessary to tackle complex data analysis problems using advanced computational tools. The course allows for the acquisition of knowledge that expands and strengthens what is obtained in undergraduate programs, enhancing the understanding of advanced methods and techniques used in inferential and computational statistics. Additionally, the course provides the necessary tools to apply the acquired knowledge in practical contexts, design and implement solutions to real statistical problems, and formulate hypotheses on incomplete or limited information.
Modelli statistici/Statistica computazionale (Modelli statistici)
Al termine dell’insegnamento si chiederà allo studente di: - acquisire una conoscenza approfondita dei concetti e delle applicazioni dei modelli statistici avanzati utilizzati per analizzare dati complessi, anche tramite l'uso di software statistico come R - essere in grado di utilizzare le tecniche di stima dei minimi quadrati e le procedure di verifica delle ipotesi per adattare e interpretare modelli lineari per esaminare le relazioni tra variabili continue. - essere in grado di applicare i modelli lineari generalizzati per affrontare situazioni in cui la variabile di risposta segue una distribuzione diversa dalla normale, come variabili binarie, categoriche o di conteggio. - essere in grado di modellare e analizzare dati che presentano dipendenza o eterogeneità tra le unità osservate utilizzando modelli lineari generalizzati misti. - comprendere la formulazione delle distribuzioni a priori, l'applicazione della regola di Bayes per ottenere le distribuzioni a posteriori e l'interpretazione dei risultati ottenuti dai modelli bayesiani. - esserein grado di applicare le conoscenze acquisite per analizzare e interpretare dati complessi in contesti reali, come l'analisi di dati provenienti da studi clinici, sondaggi, dati finanziari o dati biologici. - sviluppare la capacità di valutare criticamente i modelli statistici, compresi i modelli lineari, i modelli lineari generalizzati, i modelli lineari generalizzati misti e i modelli bayesiani, e di interpretare in modo accurato i risultati ottenuti.
Modelli statistici/Statistica computazionale (Statistica computazionale)
Al termine dell’insegnamento si chiederà allo studente di: - comprendere la rappresentazione gerarchici dei modelli probabilistici - comprendere il concetto di variabile latente e la loro utilità nei modelli - essere in grado di formalizzare un modello gerarchico, sia in ottica Bayesiana che frequentista - essere in grado di implementare un algoritmo per stimare un modello gerarchico - essere in grado di formalizzare e applicare modelli a dati reali complessi - essere in grado di simulare dati da modello utilizzando metodi Monte Carlo - sviluppare la capacità di formalizzare ipotesi circa le relazioni tra variabili osservate e latenti - sviluppare la capacità di valutare criticamente la bontà e aderenza del modello ai dati
Modelli statistici/Statistica computazionale (Modelli statistici)
The student will learn how to apply in practice the statistical methods s/he has studied in theory, in order to use all of their methodological potentials.
Modelli statistici/Statistica computazionale (Statistica computazionale)
The student will learn how to apply in practice the statistical methods s/he has studied in theory, in order to use all of their methodological potentials.
Modelli statistici/Statistica computazionale (Modelli statistici)
Si presume che gli studenti conoscano gli argomenti trattati dai corsi standard di matematica impartiti nei primi due anni dei corsi di ingegneria. Inoltre, è richiesta la conoscenza di concetti base di probabilità e statistica: pdf continue e discrete (e.g., distribuzione normale o di Poisson), valore atteso, varianza, covarianza (una preparazione equivalente a 15 crediti di Probabilità e Statistica Matematica.), probabilità condizionata.
Modelli statistici/Statistica computazionale (Statistica computazionale)
Si presume che gli studenti conoscano gli argomenti trattati dai corsi standard di matematica impartiti nei corsi di ingegneria. Inoltre, è richiesta la conoscenza di concetti base di probabilità e statistica, quali pmf/pdf, stimatori di massima verosimiglianza, condizionamento, distribuzioni multivariate, teorema di Bayes (una preparazione equivalente a 15 crediti di Probabilità e Statistica Matematica) e del software R.
Modelli statistici/Statistica computazionale (Modelli statistici)
Previous education equivalent to 15 credits of Probability and Mathematical Statistics.
Modelli statistici/Statistica computazionale (Statistica computazionale)
Previous education equivalent to 15 credits of Probability and Mathematical Statistics.
Modelli statistici/Statistica computazionale (Modelli statistici)
Durante l’insegnamento verranno trattati i seguenti argomenti - Modelli lineari - Modelli lineari generalizzati -Modelli lineari generalizzati misti - Dati categorici - Statistica Bayesiana - software R, con cenni ad altri software
Modelli statistici/Statistica computazionale (Statistica computazionale)
L'insegnamento è diviso in 3 moduli. Modulo 1 (6 CFU). In questo modulo si affronteranno gli argomenti teorici generali - DAG per la rappresentazione di modelli - Stimatori Monte Carlo - Markov Chains - Algoritmi Markov chain Monte Carlo e Expectation Maximization Modulo 2 (4 CFU) - In questo modulo si studieranno modelli per dati con dipendenza strutturata - Processi Gaussiani e loro utilizzo per modelli non parametrici - Geostatistica - Serie Storiche - Teorema di Hammersley–Clifford e Lemma di Brooks - Automodelli e Modelli su Grafo Modulo 3 (2 CFU) - in questo modulo si studieranno i modelli di tipo mistura - Modelli mistura - Modelli mistura per serie temporali: Hidden Markov Model - Algoritmo di VIterbi - Change-point model e modelli per anomaly detection
Modelli statistici/Statistica computazionale (Modelli statistici)
Linear models and their applications. Generalized linear models. Principles of clinical and biomedical experimentation. Parametric and nonparametric survival and reliability. Principal components Discriminant analysis. Introduction to Bayesian networks. Categorical data. R, OpenBUGS and other specialized software.
Modelli statistici/Statistica computazionale (Statistica computazionale)
Linear models and their applications. Generalized linear models. Principles of clinical and biomedical experimentation. Parametric and nonparametric survival and reliability. Principal components Discriminant analysis. Introduction to Bayesian networks. Categorical data. R, OpenBUGS and other specialized software.
Modelli statistici/Statistica computazionale (Modelli statistici)
Modelli statistici/Statistica computazionale (Statistica computazionale)
Modelli statistici/Statistica computazionale (Modelli statistici)
Modelli statistici/Statistica computazionale (Statistica computazionale)
Modelli statistici/Statistica computazionale (Modelli statistici)
Verranno impartite lezioni e esercitazioni. Mediamente, 3 ore di lezioni a settimana più un'ora e mezza di esercitazioni. Durante le lezioni si farà uso di lucidi e note scritte a mano (su tablet). Occasionalmente si farà anche uso della lavagna. Per meglio comprendere molti dei concetti e/o modelli, si farà ricorso all'uso del computer per simulazioni o per mostrare le analisi su dataset. I linguaggi usati saranno per la maggior parte R, ma saranno fatti cenni ad altri codici.
Modelli statistici/Statistica computazionale (Statistica computazionale)
Verranno impartite lezioni e esercitazioni. Mediamente, 3 ore di lezioni a settimana più un'ora e mezza di esercitazioni. Durante le lezioni si farà uso di lucidi e note scritte a mano (su tablet). Occasionalmente si farà anche uso della lavagna. Per meglio comprendere molti dei concetti e/o modelli, si farà ricorso all'uso del computer per simulazioni o per mostrare le analisi su dataset. I linguaggi usati saranno per la maggior parte R, JAGS, STAN, INLA. Gli script usati durante le lezioni faranno parte del materiale didattico dato agli studenti.
Modelli statistici/Statistica computazionale (Modelli statistici)
Traditional exercise sessions will complement lectures, whereas appropriate statistical software will be used in computer lab sessions.
Modelli statistici/Statistica computazionale (Statistica computazionale)
Traditional exercise sessions will complement lectures, whereas appropriate statistical software will be used in computer lab sessions.
Modelli statistici/Statistica computazionale (Modelli statistici)
- Agresti A. (2015) Foundations of linear and generalized linear models. Wiley. - Gasparini M. (2013) Modelli probabilistici e statistici. CLUT. - Lunn D., Jackson C., Best N., Thomas A. and Spiegelhalter D. (2013) The BUGS book. A practical introduction to Bayesian Analysis. CRC Press. - Fahrmeier L., Kneib T., Lang S and Marx B.D. Regression. Second edition 2022. https://github.com/toyo97/statistical-models-r
Modelli statistici/Statistica computazionale (Statistica computazionale)
Modulo 1 - Introducing Monte Carlo Methods with R. By Christian Robert, George Casella - A Student’s Guide to Bayesian Statistics 1st Edition, by Ben Lambert - The EM Algorithm and Extensions 2nd Edition. By Geoffrey J. McLachlan, Thriyambakam Krishnan Modulo 2 - Hierarchical Modeling and Analysis for Spatial Data, 2nd Edition. By Sudipto Banerjee, Bradley P. Carlin, Alan E. Gelfand Modulo 3 - Hidden Markov Models for Time Series. An Introduction Using R, Second Edition. By Walter Zucchini, Iain L. MacDonald, Roland Langrock
Modelli statistici/Statistica computazionale (Modelli statistici)
- An Introduction to Statistical Learning with Applications in R Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani http://faculty.marshall.usc.edu/gareth-james/ISL/ - The BUGS Book: A Practical Introduction to Bayesian Analysis by David Lunn, Chris Jackson, Nicky Best, Andrew Thomas, David Spiegelhalter. Chapman & Hall. - Categorical Data Analysis by Alan Agresti. Wiley - Statistical analysis of designed experiments by Ajit C. Tamhane. Wiley - Foundations of Linear and Generalized Linear Models by Alan Agresti
Modelli statistici/Statistica computazionale (Statistica computazionale)
- An Introduction to Statistical Learning with Applications in R Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani http://faculty.marshall.usc.edu/gareth-james/ISL/ - The BUGS Book: A Practical Introduction to Bayesian Analysis by David Lunn, Chris Jackson, Nicky Best, Andrew Thomas, David Spiegelhalter. Chapman & Hall. - Categorical Data Analysis by Alan Agresti. Wiley - Statistical analysis of designed experiments by Ajit C. Tamhane. Wiley - Foundations of Linear and Generalized Linear Models by Alan Agresti
Modelli statistici/Statistica computazionale (Modelli statistici)
Slides; Libro di testo; Esercitazioni di laboratorio;
Modelli statistici/Statistica computazionale (Statistica computazionale)
Slides; Libro di testo;
Modelli statistici/Statistica computazionale (Modelli statistici)
Lecture slides; Text book; Lab exercises;
Modelli statistici/Statistica computazionale (Statistica computazionale)
Lecture slides; Text book;
Modelli statistici/Statistica computazionale (Modelli statistici)
Modalità di esame: Prova scritta (in aula); Prova orale facoltativa;
Modelli statistici/Statistica computazionale (Statistica computazionale)
Modalità di esame: Prova orale obbligatoria; Elaborato scritto individuale; Elaborato scritto prodotto in gruppo;
Modelli statistici/Statistica computazionale (Modelli statistici)
Exam: Written test; Optional oral exam;
Modelli statistici/Statistica computazionale (Statistica computazionale)
Exam: Compulsory oral exam; Individual essay; Group essay;
Modelli statistici/Statistica computazionale (Modelli statistici)
L'obiettivo dell'esame è quello di arricchire la conoscenza del candidato sugli argomenti inseriti nel programma, la conoscenza dettagliata della matematica alla base delle tecniche apprese, i loro limiti, e di testare le capacità nell'analisi dei dati utilizzando i modelli illustrati a lezione, dimostrando di saper determinare il dominio di applicabilità delle varie tecniche rispetto alla natura dei dati. L'esame consisterà in una prova scritta su due argomenti trattati nel corso, di natura teorica o applicativa, e di una una interrogazione orale facoltativa su due parole chiave (oppure argomenti oppure script di codice) estratte a caso da un lista di argomenti consegnata agli studenti a fine corso; l'esame orale può sia peggiorare che migliorare il punteggio ottenuto nello scritto.
Modelli statistici/Statistica computazionale (Statistica computazionale)
L’esame ha l’obiettivo di verificare la conoscenza degli argomenti elencati nel programma e la capacità di applicare teoria e algoritmi per fare inferenza sui parametri di modelli statistici applicati a dati reali. Lo studente può scegliere se sostenere una prova orale oppure presentare un elaborato scritto. La lode verrà assegnata solo a chi dimostrerà una comprensione approfondita degli argomenti del corso, in particolare degli algoritmi e degli aspetti computazionali. Indipendentemente dalla modalità d’esame scelta, lo studente dovrà obbligatoriamente consegnare, durante il corso o prima dell’esame, uno o più elaborati scritti che verrano discussi durante il corso. Elaborato scritto L’elaborato dovrà includere la simulazione e la successiva stima di un modello, oppure l’analisi descrittiva di un dataset reale seguita dalla stima di un modello. L’elaborato deve comprendere: • un file descrittivo contenente la spiegazione dei dati, del modello e della teoria; • uno script con il codice, scritto nel linguaggio di programmazione scelto dallo studente. Tutti i membri del gruppo devono presentare l’elaborato. Prova orale L’esame consiste in una prova orale in cui si discutono gli aspetti teorici e pratici degli argomenti trattati a lezione. Durante la prova, lo studente potrebbe essere invitato a implementare un algoritmo presentato a lezione, utilizzando il linguaggio di programmazione scelto.
Modelli statistici/Statistica computazionale (Modelli statistici)
Exam: Written test; Optional oral exam;
Modelli statistici/Statistica computazionale (Statistica computazionale)
Exam: Compulsory oral exam; Individual essay; Group essay;
Modelli statistici/Statistica computazionale (Modelli statistici)
The exam will be an oral conversation about two out of around twenty case studies seen in class
Modelli statistici/Statistica computazionale (Statistica computazionale)
The exam will be an oral conversation about two out of around twenty case studies seen in class