Politecnico di Torino | |||||||||||||||||
Anno Accademico 2017/18 | |||||||||||||||||
01REURT Statistical learning |
|||||||||||||||||
Dottorato di ricerca in Matematica Pura E Applicata - Torino |
|||||||||||||||||
|
|||||||||||||||||
|
|||||||||||||||||
Presentazione
PERIODO: APRILE - LUGLIO
Il corso, che ha come prerequisito la conoscenza dei fondamenti della teoria delle probabilità e della statistica inferenziale, completa la formazione dello studente di dottorato su: 1) metodi di apprendimento statistico e modelli di ottimizzazione; 2) modelli gerarchici e statistica bayesiana; 3) dipendenze tra variabili casuali e teoria delle copule; 4) metodi statistici per la pianificazione degli esperimenti. I metodi verranno illustrati in concreto mediante applicazioni del software R e/o SAS a problemi di tipo industriale, scientifico e gestionale, in modo da rendere il corso di interesse per un ampio spettro di studenti di dottorato. Knowledge of the basics of probability theory and inferential statistics is a prerequisite. The course aims at completing the education of Ph.D. students about: 1) methods for statistical learning and their relationship with optimization; 2) hierarchical models and Bayesian statistics; 3) dependence among random variables and copula theory; 4) statistical methods for the Design of Experiments (DOE). All methods will be illustrated in practice using the R or the SAS software on applications to industrial, scientific and management problems, in order to make the course useful and appealing to a broad audience of Ph.D. students. |
Programma
Apprendimento statistico, analisi multivariata e ottimizzazione:
Le origini: minimi quadrati e massima verosimiglianza Ottimizzazione nei metodi standard di analisi multivariata (PCA, clustering) Modelli di ottimizzazione per problem di fitting e stima Il tradeoff tra bias e varianza: regolarizzazione e ottimizzazione robusta, applicazione a modelli di regressione e classificazione (support vector machine) Apprendimento statistico e ottimizzazione stocastica: programmazione dinamica approssimata Modelli gerarchici bayesiani: l'impostazione bayesiana dell'inferenza statistica a priori coniugate e calcoli in forma chiusa applicazioni industriali e scientifiche modelli gerarchici calcoli approssimati con metodi Markov Chain Monte Carlo. Teoria delle copule: analisi delle proprietà di dipendenza tra vettori di variabili casuali mediante copule; proprietà essenziali e famiglie principali di copule; modelli di frailty e metodi inferenziali per i relativi parametri; concordanza e indici di concordanza. Pianificazione degli esperimenti: piani fattoriali frazionari ortogonali; piani saturi; piani ottimali. Statistical learning, multivariate analysis and optimization: The origins: least squares and max likelihood Optimization in standard multivariate methods (PCA, clustering) Optimization modeling approaches in fitting and estimation The bias-variance tradeoff: regularization and robust optimization, and applications to regression and classifiers (support vector machines) Statistics and stochastic optimization: approximate dynamic programming Hierarchical Bayesian Models: the Bayesian approach to statistical inference; conjugate priors and analytical solutions in closed form; industrial and scientific applications; hierarchical models; numerical computations by Markov Chain Monte Carlo methods. Copula theory: analysis of dependence properties of random vectors by means of copulas; basic properties and main families of copulas; frailty models and inference methods for the frailty parameters; concordance and indexes of concordance. Design of Experiments: orthogonal fractional factorial designs; saturated designs; optimal designs. |
Orario delle lezioni |
Statistiche superamento esami |
|