Politecnico di Torino
Politecnico di Torino
   
Login  
en
Politecnico di Torino
Anno Accademico 2014/15
01NWAOV
Codifica Video
Corso di Laurea Magistrale in Ingegneria Informatica (Computer Engineering) - Torino
Docente Qualifica Settore Lez Es Lab Anni incarico
Magli Enrico ORARIO RICEVIMENTO O2 ING-INF/03 80 0 0 4
SSD CFU Attivita' formative Ambiti disciplinari
ING-INF/03 6 D - A scelta dello studente A scelta dello studente
Presentazione
The course is taught in Italian

In questo corso si trattano alcune tematiche fondamentali relative alla visione, ovvero i principi di base della compressione di dati, audio, immagini e video, inclusi i rispettivi modelli di segnale, e l’elaborazione di informazioni visuali ai fini della loro interpretazione. La parte del corso relativa alla compressione parte dagli elementi teorici fondamentali e prosegue con la loro applicazione ai più importanti standard internazionali di compressioni, coprendo diversi "media" quali audio, immagini e video. Vengono poi utilizzati concetti di elaborazione delle immagini per introdurre sistemi più complessi di visione, che utilizzano descrittori invarianti per estrarre e descrivere proprietà importanti delle immagini. Viene mostrata l’applicazione di "ricerca visuale" come esempio di uso in uno scenario reale.
Risultati di apprendimento attesi
Il corso metterà lo studente in grado di ottenere i seguenti risultati.
1. Conoscenza dei fondamenti teorici della compressione senza perdite e con perdite
2. Conoscenza di metodi avanzati di compressione dati
3. Conoscenza di metodi avanzati di quantizzazione
4. Conoscenza della teoria della codifica a trasformata
5. Conoscenza delle tecniche di stima del movimento e la loro applicazione alla compressione video
6. Conoscenza di alcuni standard di riferimento per la compressione di audio, immagini e video
7. Conoscenza delle tecniche di visione (rilevazione di punti chiave, tecniche multiscala, descrittori) utilizzate nella ricerca e classificazione di contenuti visuali.

Una eventuale tesina permetterà anche di effettuare un’esperienza pratica e di migliorare le capacità di comunicazione.
Prerequisiti / Conoscenze pregresse
Si intendono già acquisiti da parte dello studente i concetti di base relativi alla teoria dei segnali e sistemi a tempo continuo e tempo discreto e dei processi aleatori. In particolare i seguenti concetti vengono utilizzati nel corso.
• Trasformate di Fourier, segnali e sistemi nel dominio del tempo e della frequenza, filtri LTI.
• Segnali a tempo discreto, spettro di segnali a tempo discreto e legame con la trasformata di Fourier di segnali analogici, trasformata "z" e filtri LTI a tempo discreto di tipo FIR e IIR.
• Processi gaussiani, processi aleatori di tipo stazionario in senso lato, funzione di autocorrelazione e covarianza, spettro di potenza di processi casuali, rumore bianco.

Il corso utilizzerà inoltre concetti già presentati nel corso di laurea triennale "Elaborazione di immagine e video", che verranno brevemente rivisti in questo corso.
Inoltre, per effettuare le tesine, si assume che lo studente sia in grado di programmare in linguaggio C e conosca il linguaggio Matlab.
Programma
• I Fondamenti di teoria dell’informazione per la compressione (2h)
• Codifica di Golomb e codifica aritmetica (3h)
• Tecniche di quantizzazione avanzata (quantizzazione entropy-constrained e vettoriale, gli algoritmi LBG e k-means) (4h)
• Teoria della codifica a trasformata, trasformata KLT, bit allocation per quantizzatori indipendenti, principi di ottimizzazione Lagrangiana (8h)
• Operatori di sotto- e sovra-campionamento. Trasformata wavelet. (4h)
• Codifica a zerotree. Lo standard JPEG 2000. (2h)
• Fondamenti di compressione audio (4h)
• Stima del movimento (4h)
• Principi di compressione video a trasformata e ibrida trasformata/predizione (4h)
• Lo standard H.265/HEVC (2h)
• Rilevazione di bordi e angoli, processing multiscala (4h)
• Descrittori SIFT e "bag-of-visual-words", classificazione di immagini (4h)
Organizzazione dell'insegnamento
Il corso prevede principalmente l’utilizzo di lezioni in aula. Per gli studenti dei corsi di laurea al di fuori dell’Ingegneria dell’Informazione sarà effettuato un azzeramento di circa 20 ore sugli argomenti legati alla teoria dei segnali.
Si prevede di effettuare delle tesine che verranno valutate alla fine del corso. In alternativa, e a seconda del numero di studenti, si potranno effettuare esercitazioni al LAIB, dove gli studenti potranno mettere in pratica le metodologie di progetto ed analisi apprese durante le lezioni.
Testi richiesti o raccomandati: letture, dispense, altro materiale didattico
Per quanto riguarda le tecniche di compressione il testo di riferimento e’
• K. Sayood,Introduction to data compression, 3rd edition, Kluwer

Per quanto riguarda gli aspetti di visione il testo di riferimento e’
• S.J.D. Prince, Computer vision: models, learning and inference, Cambridge University Press, 2012
Criteri, regole e procedure per l'esame
L’esame finale comprende uno scritto e può opzionalmente comprendere lo svolgimento e la valutazione di una tesina o di laboratori.
Il voto finale è una media pesata della valutazione dello scritto e dell’eventuale tesina o relazioni di laboratorio. I pesi verranno comunicati all’inizio del corso.
Orario delle lezioni
Statistiche superamento esami

Programma definitivo per l'A.A.2014/15
Indietro



© Politecnico di Torino
Corso Duca degli Abruzzi, 24 - 10129 Torino, ITALY
WCAG 2.0 (Level AA)
Contatti