KEYWORD |
Riconoscimento automatico del parlato conversazionale
Tesi esterna in azienda
Parole chiave CLASSIFICAZIONE FONETICA, RETI NEURALI ARTIFICIALI, RICONOSCIMENTO DEL PARLATO
Riferimenti PIETRO LAFACE
Riferimenti esterni Roberto Gemello, Daniele Colibro, Claudio Vair (LOQUENDO)
Gruppi di ricerca SPEECH RECOGNITION GROUP - SRG
Tipo tesi SOFTWARE SPERIMENTALE
Descrizione SPEECH RECOGNITION GROUP del Dipartimento di Automatica e Informatica collabora da molti anni con LOQUENDO, azienda leader nelle tecnologie vocali con sede a Torino, esplorando nuove soluzioni tecnologiche e sviluppando algoritmi che aumentino le prestazioni e l'efficienza computazionale dei riconoscitori.
LOQUENDO ha nel suo catalogo un prodotto per il riconoscimento automatico in circa 20 lingue differenti,
progettati per essere utilizzati in un ampio spettro di applicazioni che spazia dal riconoscimento
di parole isolate alla dettatura di referti clinici mediante parlato continuo.
Negli ultimi anni il parlato naturale, in particolare conversazionale, sta attirando l'interesse
scientifico ed aziendale per le sfide che esso pone e per le sue possibili applicazioni che vanno dalla
trascrizione di meeting, alla sottotitolatura di film o passaggi televisivi, l'identificazione dei contenuti multimediali, fino al campo della sicurezza, per esempio per l'identificazione del linguaggio parlato, del parlatore o per la rilevazione di parole chiave sensibili all'interno di una conversazione.
L'obiettivo di questa tesi di laurea è quello di evolvere un sistema di riconoscimento esistente basato
sulla classificazione fonetica mediante reti neurali.
L'evoluzione consiste nella definizione di nuove architetture per le reti neurali, che consentano di modellare con più precisione i fonemi di una lingua pronunciati nell'ambito di una conversazione, catturando contesti temporali molto più grandi di quelli attualmente utilizzati.
Il lavoro di questa tesi, da sviluppare parzialmente o totalmente presso LOQUENDO, con la supervisione continua del relatore, consiste nello sviluppo di moduli software, in linguaggio C, a partire da librerie disponibili, per l'addestramento di modelli fonetici neurali, e nella valutazione sperimentale su uno o più database significativi della bontà delle architetture dei classificatori implementati.
Vedi anche http://www.loquendo.com/it/
Conoscenze richieste Si richiede una buona capacità di programmazione in linguaggio C e Unix shell
Note La tesi prevede un rimborso spese per la presenza in Azienda.
Inviare un curriculum ed una copia del piano di studi con le votazioni riportate a pietro.laface@polito.it
Scadenza validita proposta 08/12/2011
PROPONI LA TUA CANDIDATURA