01OHENG
A.A. 2024/25
Italiano
Corso di Laurea Magistrale in Ingegneria Matematica - Torino
02NMRNG 02NMRPF
Didattica | Ore |
---|---|
Lezioni | 40 |
Esercitazioni in aula | 20 |
Docente | Qualifica | Settore | h.Lez | h.Es | h.Lab | h.Tut | Anni incarico |
---|---|---|---|---|---|---|---|
Gasparini Mauro | Professore Ordinario | STAT-01/A | 30 | 0 | 0 | 0 | 8 |
Docente | Qualifica | Settore | h.Lez | h.Es | h.Lab | h.Tut |
---|---|---|---|---|---|---|
Ratta Marco | Dottorando | 10 | 20 | 0 | 0 |
SSD | CFU | Attivita' formative | Ambiti disciplinari | SECS-S/01 | 6 | C - Affini o integrative | Attività formative affini o integrative |
---|
Italiano
Corso di Laurea Magistrale in Ingegneria Matematica - Torino
01OHFNG
Didattica | Ore |
---|---|
Lezioni | 40 |
Esercitazioni in aula | 20 |
Docente | Qualifica | Settore | h.Lez | h.Es | h.Lab | h.Tut | Anni incarico |
---|---|---|---|---|---|---|---|
Mastrantonio Gianluca | Professore Associato | STAT-01/A | 40 | 20 | 0 | 0 | 1 |
SSD | CFU | Attivita' formative | Ambiti disciplinari | SECS-S/01 SECS-S/01 |
2 4 |
C - Affini o integrative F - Altre attività (art. 10) |
Attività formative affini o integrative Altre conoscenze utili per l'inserimento nel mondo del lavoro |
---|
Modelli statistici/Statistica computazionale (Modelli statistici)
L'insegnamento è progettato per fornire agli studenti una solida comprensione dei concetti e delle applicazioni dei modelli statistici avanzati utilizzati per analizzare dati complessi. Il corso si concentra sull'apprendimento e l'applicazione modelli lineari (Lm), modelli lineari generalizzati (GLM) e modelli lineari generalizzati misti (GLMM), nonché sui principi fondamentali della statistica bayesiana. Durante il corso, gli studenti acquisiranno conoscenze approfondite sulle teorie e le metodologie dei modelli statistici. Saranno introdotti ai modelli lineari, che rappresentano una classe di modelli ampiamente utilizzati per esaminare risposte continue, e in particolare gaussiane. Gli studenti impareranno a utilizzare le tecniche di stima dei minimi quadrati e le procedure di verifica delle ipotesi per adattare e interpretare i modelli lineari. Successivamente, il corso si concentrerà sui modelli lineari generalizzati, che rappresentano una generalizzazione dei modelli lineari per variabili di risposta che seguono una distribuzione diversa dalla gaussiana. Gli studenti impareranno a utilizzare i modelli lineari generalizzati per affrontare situazioni in cui la variabile di risposta può essere binaria, categorica o di conteggio. Verranno approfonditi metodi statistici per variabili categoriche e per problemi basati su di esse, come l'analisi delle classifiche e dei ranghi, la modellizzazione dei questionari a risposta multipla e la misura dell'accordo tra valutatori. Il corso approfondirà inoltre i modelli lineari generalizzati misti, che estendono i modelli lineari generalizzati per affrontare la presenza di dati correlati o raggruppati. Gli studenti impareranno a modellare e analizzare dati che presentano dipendenza o eterogeneità tra le unità osservate. Infine, il corso fornirà una panoramica dei principi e delle applicazioni dei modelli bayesiani. Gli studenti impareranno i concetti chiave della statistica bayesiana, inclusa la formulazione delle distribuzioni a priori, l'applicazione della regola di Bayes per ottenere le distribuzioni a posteriori e l'interpretazione dei risultati ottenuti dai modelli bayesiani. I metodi computazionali utilizzati per l'inferenza bayesiana, come l'utilizzo delle catene di Markov Monte Carlo (MCMC), sono insegnati nell'insegnamento abbinato "Statistica computazione". Durante l'insegnamento verranno insegnati alcuni linguaggi statistici, principalmente R.
Modelli statistici/Statistica computazionale (Statistica computazionale)
L'analisi dei dati, in particolare quando si lavora con i Big Data e con dati caratterizzati da dipendenze strutturate, richiede una profonda comprensione del meccanismo generativo dei dati, delle fonti di rumore e delle variabili confondenti. Per questo motivo, la capacità di formalizzare un modello che descriva accuratamente le relazioni tra variabili osservate e variabili/processi latenti, e di implementare un algoritmo di stima nel contesto appropriato, è fondamentale per chi intende lavorare nel campo dell'analisi dei dati, sia come statistico sia come data scientist. L'insegnamento della Statistica Computazionale mira a fornire le basi teoriche e pratiche necessarie per affrontare problemi complessi di analisi dei dati mediante strumenti computazionali avanzati. Il corso permette di acquisire conoscenze che ampliano e rafforzano quelle ottenute nei programmi di laurea triennale, migliorando la comprensione dei metodi e delle tecniche avanzate utilizzate nella statistica inferenziale e computazionale. Inoltre, il corso fornisce gli strumenti necessari per applicare le conoscenze acquisite in contesti pratici, progettare e implementare soluzioni a problemi statistici reali, e formulare ipotesi su informazioni incomplete o limitate.
Modelli statistici/Statistica computazionale (Modelli statistici)
The course is designed to provide students with a solid understanding of the concepts and applications of advanced statistical models used for analyzing complex data. The course focuses on learning and applying linear models (Lm), generalized linear models (GLM), and generalized linear mixed models (GLMM), as well as the fundamental principles of Bayesian Statistics. During the course, students will acquire in-depth knowledge of the theories and methodologies of statistical models. They will be introduced to linear models, which represent a widely used class of models to tackle continuous (in particular, Gaussian) responses. Students will learn how to use least squares estimation techniques and hypothesis testing procedures to fit and interpret linear models. Subsequently, the course will concentrate on generalized linear models, which extend linear models to response variables other than normal. Students will learn to use generalized linear models to address situations where the response variable can be binary, categorical, or a count. Particular emphasis will be put on categorical responses and on problems based on them, such as the analysis of ranks and rankings, the measurement of rater agreement and the analysis of poll data. The course will also delve into generalized linear mixed models, which extend generalized linear models to address the presence of correlated or clustered data. Students will learn to model and analyze data that exhibit dependence or heterogeneity among the observed units. Finally, the course will provide an overview of the principles and applications of Bayesian models. Students will learn key concepts of Bayesian statistics, including the formulation of prior distributions, the application of Bayes' rule to obtain posterior distributions, and the interpretation of results obtained from Bayesian models. Computational methods used for Bayesian inference, such as Markov Chain Monte Carlo (MCMC) techniques, are taught in the parallel course "Computational Statistics". In this course, statistical languages will be taught; primarily R.
Modelli statistici/Statistica computazionale (Statistica computazionale)
Data analysis, particularly when working with Big Data and data characterized by structured dependencies, requires a deep understanding of the generative mechanism of the data, the sources of noise, and confounding variables. For this reason, the ability to formalize a model that accurately describes the relationships between observed variables and latent variables/processes, and to implement an estimation algorithm in the appropriate context, is fundamental for those intending to work in the field of data analysis, whether as a statistician or a data scientist. The teaching of Computational Statistics aims to provide the theoretical and practical foundations necessary to tackle complex data analysis problems using advanced computational tools. The course allows for the acquisition of knowledge that expands and strengthens what is obtained in undergraduate programs, enhancing the understanding of advanced methods and techniques used in inferential and computational statistics. Additionally, the course provides the necessary tools to apply the acquired knowledge in practical contexts, design and implement solutions to real statistical problems, and formulate hypotheses on incomplete or limited information.
Modelli statistici/Statistica computazionale (Modelli statistici)
Al termine dell’insegnamento si chiederà allo studente di: - acquisire una conoscenza approfondita dei concetti e delle applicazioni dei modelli statistici avanzati utilizzati per analizzare dati complessi, anche tramite l'uso di software statistico come R - essere in grado di utilizzare le tecniche di stima dei minimi quadrati e le procedure di verifica delle ipotesi per adattare e interpretare modelli lineari per esaminare le relazioni tra variabili continue. - essere in grado di applicare i modelli lineari generalizzati per affrontare situazioni in cui la variabile di risposta segue una distribuzione diversa dalla normale, come variabili binarie, categoriche o di conteggio. - essere in grado di modellare e analizzare dati che presentano dipendenza o eterogeneità tra le unità osservate utilizzando modelli lineari generalizzati misti. - comprendere la formulazione delle distribuzioni a priori, l'applicazione della regola di Bayes per ottenere le distribuzioni a posteriori e l'interpretazione dei risultati ottenuti dai modelli bayesiani. - esserein grado di applicare le conoscenze acquisite per analizzare e interpretare dati complessi in contesti reali, come l'analisi di dati provenienti da studi clinici, sondaggi, dati finanziari o dati biologici. - sviluppare la capacità di valutare criticamente i modelli statistici, compresi i modelli lineari, i modelli lineari generalizzati, i modelli lineari generalizzati misti e i modelli bayesiani, e di interpretare in modo accurato i risultati ottenuti.
Modelli statistici/Statistica computazionale (Statistica computazionale)
Al termine dell’insegnamento si chiederà allo studente di: - comprendere la rappresentazione gerarchici dei modelli probabilistici - comprendere il concetto di variabile latente e la loro utilità nei modelli - essere in grado di formalizzare un modello gerarchico, sia in ottica Bayesiana che frequentista - essere in grado di implementare un algoritmo per stimare un modello gerarchico - essere in grado di formalizzare e applicare modelli a dati reali complessi - essere in grado di simulare dati da modello utilizzando metodi Monte Carlo - sviluppare la capacità di formalizzare ipotesi circa le relazioni tra variabili osservate e latenti - sviluppare la capacità di valutare criticamente la bontà e aderenza del modello ai dati
Modelli statistici/Statistica computazionale (Modelli statistici)
The student will learn how to apply in practice the statistical methods s/he has studied in theory, in order to use all of their methodological potentials.
Modelli statistici/Statistica computazionale (Statistica computazionale)
The student will learn how to apply in practice the statistical methods s/he has studied in theory, in order to use all of their methodological potentials.
Modelli statistici/Statistica computazionale (Modelli statistici)
Si presume che gli studenti conoscano gli argomenti trattati dai corsi standard di matematica impartiti nei primi due anni dei corsi di ingegneria. Inoltre, è richiesta la conoscenza di concetti base di probabilità e statistica: pdf continue e discrete (e.g., distribuzione normale o di Poisson), valore atteso, varianza, covarianza (una preparazione equivalente a 15 crediti di Probabilità e Statistica Matematica.), probabilità condizionata.
Modelli statistici/Statistica computazionale (Statistica computazionale)
Si presume che gli studenti conoscano gli argomenti trattati dai corsi standard di matematica impartiti nei corsi di ingegneria. Inoltre, è richiesta la conoscenza di concetti base di probabilità e statistica, quali pmf/pdf, stimatori di massima verosimiglianza, condizionamento, distribuzioni multivariate, teorema di Bayes (una preparazione equivalente a 15 crediti di Probabilità e Statistica Matematica) e del software R.
Modelli statistici/Statistica computazionale (Modelli statistici)
Previous education equivalent to 15 credits of Probability and Mathematical Statistics.
Modelli statistici/Statistica computazionale (Statistica computazionale)
Previous education equivalent to 15 credits of Probability and Mathematical Statistics.
Modelli statistici/Statistica computazionale (Modelli statistici)
Durante l’insegnamento verranno trattati i seguenti argomenti - Modelli lineari - Modelli lineari generalizzati -Modelli lineari generalizzati misti - Dati categorici - Statistica Bayesiana - software R, con cenni ad altri software
Modelli statistici/Statistica computazionale (Statistica computazionale)
L'insegnamento è diviso in 3 moduli. Modulo 1 (4 CFU). In questo modulo si affronteranno gli argomenti teorici generali - DAG per la rappresentazione di modelli - Stimatori Monte Carlo - Markov Chains - Algoritmi Markov chain Monte Carlo e Expectation Maximization -Bootstrap Modulo 2 (4 CFU) - In questo modulo si studieranno modelli per dati con dipendenza strutturata - Processi Gaussiani e loro utilizzo per modelli non parametrici - Geostatistica - Accenni di Serie Storiche - Teorema di Hammersley–Clifford e Lemma di Brooks - Automodelli e Modelli su Grafo Modulo 3 (4 CFU) - in questo modulo si studieranno i modelli di tipo mistura - Modelli mistura base - Modelli mistura per serie temporali e Hidden Markov Model - Algoritmo di VIterbi - Change-point model e modelli per anomaly detection
Modelli statistici/Statistica computazionale (Modelli statistici)
Linear models and their applications. Generalized linear models. Principles of clinical and biomedical experimentation. Parametric and nonparametric survival and reliability. Principal components Discriminant analysis. Introduction to Bayesian networks. Categorical data. R, OpenBUGS and other specialized software.
Modelli statistici/Statistica computazionale (Statistica computazionale)
Linear models and their applications. Generalized linear models. Principles of clinical and biomedical experimentation. Parametric and nonparametric survival and reliability. Principal components Discriminant analysis. Introduction to Bayesian networks. Categorical data. R, OpenBUGS and other specialized software.
Modelli statistici/Statistica computazionale (Modelli statistici)
Modelli statistici/Statistica computazionale (Statistica computazionale)
Modelli statistici/Statistica computazionale (Modelli statistici)
Modelli statistici/Statistica computazionale (Statistica computazionale)
Modelli statistici/Statistica computazionale (Modelli statistici)
Verranno impartite lezioni e esercitazioni. Mediamente, 3 ore di lezioni a settimana più un'ora e mezza di esercitazioni. Durante le lezioni si farà uso di lucidi e note scritte a mano (su tablet). Occasionalmente si farà anche uso della lavagna. Per meglio comprendere molti dei concetti e/o modelli, si farà ricorso all'uso del computer per simulazioni o per mostrare le analisi su dataset. I linguaggi usati saranno per la maggior parte R, ma saranno fatti cenni ad altri codici.
Modelli statistici/Statistica computazionale (Statistica computazionale)
Verranno impartite lezioni e esercitazioni. Mediamente, 3 ore di lezioni a settimana più un'ora e mezza di esercitazioni. Durante le lezioni si farà uso di lucidi e note scritte a mano (su tablet). Occasionalmente si farà anche uso della lavagna. Per meglio comprendere molti dei concetti e/o modelli, si farà ricorso all'uso del computer per simulazioni o per mostrare le analisi su dataset. I linguaggi usati saranno per la maggior parte R, JAGS, STAN, INLA. Gli script usati durante le lezioni faranno parte del materiale didattico dato agli studenti.
Modelli statistici/Statistica computazionale (Modelli statistici)
Traditional exercise sessions will complement lectures, whereas appropriate statistical software will be used in computer lab sessions.
Modelli statistici/Statistica computazionale (Statistica computazionale)
Traditional exercise sessions will complement lectures, whereas appropriate statistical software will be used in computer lab sessions.
Modelli statistici/Statistica computazionale (Modelli statistici)
- Agresti A. (2015) Foundations of linear and generalized linear models. Wiley. - Gasparini M. (2013) Modelli probabilistici e statistici. CLUT. - Lunn D., Jackson C., Best N., Thomas A. and Spiegelhalter D. (2013) The BUGS book. A practical introduction to Bayesian Analysis. CRC Press. - Seber, G.A.F. (1977) Linear Regression Analysis. Wiley. https://github.com/toyo97/statistical-models-r
Modelli statistici/Statistica computazionale (Statistica computazionale)
Modulo 1 - Introducing Monte Carlo Methods with R. By Christian Robert, George Casella - A Student’s Guide to Bayesian Statistics 1st Edition, by Ben Lambert - The EM Algorithm and Extensions 2nd Edition. By Geoffrey J. McLachlan, Thriyambakam Krishnan Modulo 2 - Hierarchical Modeling and Analysis for Spatial Data, 2nd Edition. By Sudipto Banerjee, Bradley P. Carlin, Alan E. Gelfand Modulo 3 - Hidden Markov Models for Time Series. An Introduction Using R, Second Edition. By Walter Zucchini, Iain L. MacDonald, Roland Langrock
Modelli statistici/Statistica computazionale (Modelli statistici)
- An Introduction to Statistical Learning with Applications in R Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani http://faculty.marshall.usc.edu/gareth-james/ISL/ - The BUGS Book: A Practical Introduction to Bayesian Analysis by David Lunn, Chris Jackson, Nicky Best, Andrew Thomas, David Spiegelhalter. Chapman & Hall. - Categorical Data Analysis by Alan Agresti. Wiley - Statistical analysis of designed experiments by Ajit C. Tamhane. Wiley - Foundations of Linear and Generalized Linear Models by Alan Agresti
Modelli statistici/Statistica computazionale (Statistica computazionale)
- An Introduction to Statistical Learning with Applications in R Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani http://faculty.marshall.usc.edu/gareth-james/ISL/ - The BUGS Book: A Practical Introduction to Bayesian Analysis by David Lunn, Chris Jackson, Nicky Best, Andrew Thomas, David Spiegelhalter. Chapman & Hall. - Categorical Data Analysis by Alan Agresti. Wiley - Statistical analysis of designed experiments by Ajit C. Tamhane. Wiley - Foundations of Linear and Generalized Linear Models by Alan Agresti
Modelli statistici/Statistica computazionale (Modelli statistici)
Slides; Libro di testo; Esercitazioni di laboratorio;
Modelli statistici/Statistica computazionale (Statistica computazionale)
Slides; Libro di testo;
Modelli statistici/Statistica computazionale (Modelli statistici)
Lecture slides; Text book; Lab exercises;
Modelli statistici/Statistica computazionale (Statistica computazionale)
Lecture slides; Text book;
Modelli statistici/Statistica computazionale (Modelli statistici)
Modalità di esame: Prova orale obbligatoria;
Modelli statistici/Statistica computazionale (Statistica computazionale)
Modalità di esame: Prova orale obbligatoria; Elaborato scritto individuale; Elaborato scritto prodotto in gruppo;
Modelli statistici/Statistica computazionale (Modelli statistici)
Exam: Compulsory oral exam;
Modelli statistici/Statistica computazionale (Statistica computazionale)
Exam: Compulsory oral exam; Individual essay; Group essay;
Modelli statistici/Statistica computazionale (Modelli statistici)
L'obiettivo dell'esame è quello di arricchire la conoscenza del candidato sugli argomenti inseriti nel programma, la conoscenza dettagliata della matematica alla base delle tecniche apprese, i loro limiti, e di testare le capacità nell'analisi dei dati utilizzando i modelli illustrati a lezione, dimostrando di saper determinare il dominio di applicabilità delle varie tecniche rispetto alla natura dei dati. L'esame sarà una interrogazione orale su tre parole chiave (oppure argomenti oppure script di codice) estratte a caso da un lista di argomenti consegnata agli studenti a fine corso; la discussione di ogni parola chiave varrà approssimativamente 10 punti.
Modelli statistici/Statistica computazionale (Statistica computazionale)
L’esame ha l'obiettivo di verificare la conoscenza degli argomenti elencati nel programma e la capacità di applicare teoria e algoritmi per fare inferenza sui parametri di modelli statistici applicati a dati reali. Per ciascuno dei tre moduli, lo studente può scegliere se sostenere una prova orale oppure presentare un elaborato scritto. Ogni modulo vale 10 punti sul voto finale. La lode verrà assegnata solo a chi dimostrerà una comprensione approfondita degli argomenti del corso, specialmente su algoritmi e aspetti computazionali. - Elaborato scritto L'argomento dell'elaborato e la scadenza per la consegna verranno definiti durante il corso. L'elaborato dovrà includere la simulazione e la conseguente stima di un modello, oppure l'analisi descrittiva di un dataset reale e la successiva stima. L'elaborato deve comprendere un file che descriva i dati, il modello e la teoria, e uno script con il codice nel linguaggio di programmazione scelto dallo studente. La parte descrittiva può essere comune a tutti i membri del gruppo, mentre lo script deve essere individuale. L'elaborato deve essere presentato da tutti i membri del gruppo. - Prova orale L'esame consiste in una prova orale in cui, oltre agli aspetti teorici, possono essere discussi gli script mostrati durante le lezioni. Durante l'esame, lo studente potrebbe essere invitato a implementare un algoritmo descritto a lezione nel linguaggio di programmazione scelto.
Modelli statistici/Statistica computazionale (Modelli statistici)
Exam: Compulsory oral exam;
Modelli statistici/Statistica computazionale (Statistica computazionale)
Exam: Compulsory oral exam; Individual essay; Group essay;
Modelli statistici/Statistica computazionale (Modelli statistici)
The exam will be an oral conversation about two out of around twenty case studies seen in class
Modelli statistici/Statistica computazionale (Statistica computazionale)
The exam will be an oral conversation about two out of around twenty case studies seen in class