Politecnico di Torino

Anno Accademico 2012/13

01OVFOV, 01OVFOQ, 01OVFOT, 01OVFPE
Bioinformatics

Corso di Laurea Magistrale in Ingegneria Informatica (Computer Engineering) - Torino
Corso di Laurea Magistrale in Ingegneria Elettronica (Electronic Engineering) - Torino
Corso di Laurea Magistrale in Ingegneria Delle Telecomunicazioni (Telecommunications Engineering) - Torino
Espandi...

Docente

Qualifica

Settore

Lez

Lab

Tut

Anni incarico

SSD	CFU	Attivita' formative	Ambiti disciplinari
ING-INF/05	6	D - A scelta dello studente	A scelta dello studente

Esclusioni:
01OVA; 01OUW; 01OVD; 01OVC; 01OVE; 01OUX; 01OUZ; 01OUY; 01OVB

Presentazione

Nel corso verranno studiate le soluzioni HW/SW per l’analisi di dati genetici forniti dalle biotecnologie di ultima generazione. Verranno descritte tali tecnologie e, in particolare, approfondite le problematiche computazionali/algoritmiche per lo sviluppo di tool-flow per analisi complesse (quali ad esempio la ricerca di aberrazioni genetiche responsabili di patologie complesse come i tumori). A questo scopo verranno fornite anche le basi necessarie di biologia molecolare, e la conoscenza dei database pubblici, ontologie e tool di maggiore diffusione per le analisi genetiche. Verrà inoltre presentato brevemente il linguaggio di programmazione Python.
Rispetto agli anni passati, verranno introdotti algoritmi di Machine Learning e deep learning (es. Reti neurali, SVM, Random Forest, CNN) e verranno mostrate applicazioni di questi allo studio di problemi di biologici/medici. Verranno anche studiate soluzioni per la computazione distribuita dei dati genetici. In particolare, verrà introdotta la programmazione su cluster attraverso l’implementazione di algoritmi di analisi.
Lo scopo del corso è quindi quello di dare una formazione sufficiente a rendere esperti gli studenti delle problematiche, delle tecnologie e delle tecniche di elaborazione più all’avanguardia nel settore delle biotecnologie e del supporto informatico all’analisi genetica.

Risultati di apprendimento attesi

Lo studente deve acquisire i) conoscenze sulle biotecnologie di ultima generazione, ii) conoscenze relative alle analisi genetiche tra le più innovative nell’ambito della medicina personalizzata, iii) conoscenza delle principali soluzioni SW per analisi bioinformatiche, comprese tecniche informatiche generali quali machine learning, deep learning, text mining e ottimizzazione di grafi, iv) capacità di ideare ed applicare soluzioni algoritmiche e computazionali efficienti a problemi biologici, v) esperienza di ottimizzazione SW su cluster per applicazioni bioinformatiche.

Prerequisiti / Conoscenze pregresse

Programmazione in linguaggi ad alto livello (es. C, C++ o Java), linguaggi di scripting.

Programma

- Introduzione alla Bioinformatica: Concetti di Biologia Molecolare, Problemi di rilevanza nel campo della ricerca, dell’industria e delle aziende, Requisiti algoritmici, computazionali e tecnologici delle problematiche più emergenti; Nozioni sui principali database, ontologie e tool utilizzati in ambito bioinformatico.
- Illustrazione delle biotecnologie di ultima generazione (es. sequenziatori del genoma) e problematiche di analisi dei dati da esse prodotti
- Tematiche emergenti, DNA-, microRNA- e RNA-Sequencing: Problematiche algoritmiche e computazionali del sequenziamento del genoma e del trascrittoma umano e virale; Principali tool utilizzati per il sequenziamento e l’analisi dei dati nei casi aberranti di mutazioni, geni di fusione, alterazione nella duplicazione o espressione del DNA. Problematiche relative allo sviluppo software per analisi delle molecole RNA non-coding. Ottimizzazione parallele su architetture eterogenee, esempi.
- Processi regolativi genetici e biomolecolari: Problematiche algoritmiche e computazionali e tecniche SW per lo studio e la predizione delle interazioni regolative fra biomolecole (DNA, proteine, microRNA, mRNA, etc.), delle interazioni biomolecolari, dell’integrazione e correlazione di dati eterogenei in sistemi complessi.
- Tecniche di machine learning e deep learning: descrizione generale di alcuni approcci (es. Reti neurali, Support Vector Machines, Random Forest, Convolution Neural Network), applicazione di queste tecniche ad alcuni problemi genetici.
- Programmazione su cluster: implementazione di pipeline di analisi su computer cluster. Scheduling, decomposizione e parallelizzazione di job, ottimizzazione delle risorse computazionali.

Organizzazione dell'insegnamento

Per questo insegnamento sono previste esercitazioni e laboratori su alcuni dei tools studiati e sullo sviluppo di nuovi soluzioni SW.

Testi richiesti o raccomandati: letture, dispense, altro materiale didattico

Slide del corso, articoli scientifici e approfondimenti dal web (filmati, link a documenti).

Criteri, regole e procedure per l'esame

In alternativa, esame finale scritto o progetto di ricerca.

Statistiche superamento esami

Programma definitivo per l'A.A.2017/18