en
Politecnico di Torino
Anno Accademico 2016/17
01QFSOV, 01QFSPD
Multimedia signal processing
Corso di Laurea Magistrale in Ingegneria Informatica (Computer Engineering) - Torino
Corso di Laurea Magistrale in Ingegneria Del Cinema E Dei Mezzi Di Comunicazione - Torino
Docente Qualifica Settore Lez Es Lab Tut Anni incarico
Magli Enrico ORARIO RICEVIMENTO O2 IINF-03/A 42 0 18 0 7
SSD CFU Attivita' formative Ambiti disciplinari
ING-INF/03 6 D - A scelta dello studente A scelta dello studente
Esclusioni:
01QXY
Presentazione
In questo corso si trattano alcune tematiche fondamentali relative alla visione, ovvero i principi di base della compressione di dati, audio, immagini e video, inclusi i rispettivi modelli di segnale, e l’elaborazione di informazioni visuali ai fini della loro interpretazione. La parte del corso relativa alla compressione parte dagli elementi teorici fondamentali e prosegue con la loro applicazione ai più importanti standard internazionali di compressioni, coprendo diversi "media" quali immagini e video. Vengono poi utilizzati concetti di elaborazione delle immagini per introdurre sistemi più complessi di visione, che utilizzano descrittori invarianti e reti neurali per estrarre e descrivere proprietà importanti delle immagini. Viene mostrata l’applicazione di "ricerca visuale" come esempio di uso in uno scenario reale.
Risultati di apprendimento attesi
Il corso metterà lo studente in grado di ottenere i seguenti risultati.
1. Conoscenza dei fondamenti teorici della compressione senza perdite e con perdite
2. Conoscenza di metodi avanzati di compressione dati
3. Conoscenza della codifica a trasformata
4. Conoscenza delle tecniche di stima del movimento e la loro applicazione alla compressione video
5. Conoscenza di alcuni standard di riferimento per la compressione di immagini e video
6. Conoscenza delle tecniche di visione (rilevazione di punti chiave, tecniche multiscala, descrittori) utilizzate nella ricerca e classificazione di contenuti visuali.
Prerequisiti / Conoscenze pregresse
Si intendono già acquisiti da parte dello studente i concetti di base relativi alla teoria dei segnali e sistemi a tempo continuo e tempo discreto e dei processi aleatori. In particolare i seguenti concetti vengono utilizzati nel corso.
Trasformate di Fourier, segnali e sistemi nel dominio del tempo e della frequenza, filtri LTI.
Segnali a tempo discreto, spettro di segnali a tempo discreto e legame con la trasformata di Fourier di segnali analogici, trasformata "z" e filtri LTI a tempo discreto di tipo FIR e IIR.
Processi gaussiani, processi aleatori di tipo stazionario in senso lato, funzione di autocorrelazione e covarianza, spettro di potenza di processi casuali, rumore bianco.
Il corso utilizzerà inoltre concetti già presentati nel corso di laurea triennale "Elaborazione di immagine e video", che verranno brevemente rivisti in questo corso.
Inoltre, per effettuare le attività di laboratorio, si assume che lo studente sia in grado di programmare in linguaggio C e conosca il linguaggio Matlab.
Programma
Introduzione al digital image processing (0.3 crediti)
I Fondamenti di teoria dell’informazione per la compressione (0.2 crediti)
Codifica di Huffman e run length (0.3 crediti)
Compressione lossy e quantizzazione (0.2 crediti)
Teoria della codifica a trasformata, trasformata KLT, trasformata DCT, segnali e trasformate su grafi, trasformate direzionali (0.4 crediti)
Lo standard JPEG (0.2 crediti)
Stima del movimento (0.4 crediti)
Principi di compressione video a trasformata e ibrida trasformata/predizione (0.4 crediti)
Lo standard H.264/AVC (0.2 crediti)
Lo standard H.265/HEVC (0.2 crediti)
Rilevazione di bordi e angoli, processing multiscala (0.4 crediti)
Descrittori SIFT e "bag-of-visual-words", classificazione di immagini (0.5 crediti)
Introduzione a multimedia forensic (0.5 crediti)
Introduzione alle reti neurali (0.1 crediti)
Organizzazione dell'insegnamento
Il corso prevede principalmente l’utilizzo di lezioni in aula. Si prevede di effettuare esercitazioni al LAIB, dove gli studenti potranno mettere in pratica le metodologie di progetto ed analisi apprese durante le lezioni.
Testi richiesti o raccomandati: letture, dispense, altro materiale didattico
Per quanto riguarda le tecniche di compressione il testo di riferimento e’
K. Sayood, "Introduction to data compression, 3rd edition", Kluwer
Per quanto riguarda gli aspetti di visione il testo di riferimento e’
S.J.D. Prince, "Computer vision: models, learning and inference", Cambridge University Press, 2012
Criteri, regole e procedure per l'esame
L’esame finale comprende uno scritto e può comprendere la valutazione delle attività di laboratorio.
Il voto finale è una media pesata della valutazione dello scritto e delle relazioni di laboratorio.
Orario delle lezioni
Statistiche superamento esami

Programma definitivo per l'A.A.2016/17
Indietro