Politecnico di Torino | |||||||||||||||||||||||||
Anno Accademico 2017/18 | |||||||||||||||||||||||||
01RLONG Data spaces/Modelli statistici |
|||||||||||||||||||||||||
Corso di Laurea Magistrale in Ingegneria Matematica - Torino |
|||||||||||||||||||||||||
|
|||||||||||||||||||||||||
|
|||||||||||||||||||||||||
Esclusioni: 01RLP |
Presentazione
Verranno presentati i metodi avanzati della Statistica e i fondamenti matematici del Machine Learning, con particolare approfondimento delle strette relazioni che esistono tra le due materie.
|
Risultati di apprendimento attesi
Il corso ha come fondamenti i metodi di analisi e interpretazione dei dati tipiche della teorie frequentista e bayesiana della statistica, con l'aggiunta di alcuni nuovi elementi descrittivi provenienti dal machine learning e dalle sue formalizzazioni matematiche.
Lo studente apprenderà dei software specializzati per l'analisi dei dati (R, SAS, BUGS, STAN, MATLAB, ORANGE, RapidMiner), distinguendone opportunità, potenzialità e limiti. |
Prerequisiti / Conoscenze pregresse
Una buona conoscenza di Analisi I e II e dell'Algebra Lineare e una preparazione equivalente a 12 crediti di Probabilità e Statistica Matematica.
|
Programma
Modelli lineari (regressione, ANOVA) con predittori sia quantitativi sia qualitativi, trasformazioni, scelta del modello.
Inferenza simultanea nei modelli lineari (confronti multipli, ranking, Tukey, Scheffé) . Generalità sulla rappresentazione dei dati (topologie, metriche, dissimilarità, spazi lineari). Fondamenti matematici del machine learning (SVM, e altri). Apprendimento statistico supervisionato e non supervisionato. Metodi automatici per la classificazione, inclusi metodi ad albero. Modelli lineari generalizzati (cioé regressione logistica, di Poisson e di Cox) Modelli a effetti casuali e a effetti misti lineari e nonlineari, Reti Bayesiane (Bayesian Networks) Serie temporali (cenni a Box Jenkins) e spaziali (con cenni al kriging) |
Organizzazione dell'insegnamento
Nel corso si alterneranno lezioni teoriche a sessione di esercitazioni al computer. Sarà responsabilità dello studente fornirsi di un computer portatile e installarci il software necessario. Se necessario, I docenti lo aiuteranno in questo con interventi di supporto.
|
Testi richiesti o raccomandati: letture, dispense, altro materiale didattico
Molto materiale, specialmente software, sarà fornito sul portale della didattica.
Inoltre, per la parte di Statistica avanzata, è consigliato di consultare diversi testi, tra cui: - The BUGS Book: A Practical Introduction to Bayesian Analysis di David Lunn, Chris Jackson, Nicky Best, Andrew Thomas, David Spiegelhalter. Chapman & Hall. - Categorical Data Analysis di Alan Agresti. Wiley - Statistical analysis of designed experiments di Ajit C. Tamhane. Wiley Per la parte di Machine Learning si consiglia invece: - An introduction to Statistical Learning with Applications in R. Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani. Springer, reperibile gratuitamente e legamente dalla pagina web http://www-bcf.usc.edu/~gareth/ISL/ |
Criteri, regole e procedure per l'esame
Al termine delle lezioni, agli studenti verrà consegnato un elenco di studi di caso presentati durante il corso, corredati di illustrazioni, riferimenti bibliografici e software. Per ogni studente, da tale elenco saranno campionati due studi per Statistica e uno studio per Machine Learning, che forniranno la base per una discussione approfondita, durante l'esame orale, dei metodi usati nell'analisi di tali dati e per generalizzazioni e approfondimenti sui fondamenti teorici di tale analisi.
|
Altre informazioni Questo corso è confezionato soprattutto per gli studenti di Ingegneria Matematica, ma una versione ridotta è disponibile anche per altre ingegnerie, in particolare per Ingegneria Informatica, con il titolo Data Spaces. |
Orario delle lezioni |
Statistiche superamento esami |
|