PORTALE DELLA DIDATTICA

Ricerca CERCA
  KEYWORD

Riconoscimento automatico del parlato conversazionale

azienda Thesis in external company    


keywords CLASSIFICAZIONE FONETICA, RETI NEURALI ARTIFICIALI, RICONOSCIMENTO DEL PARLATO

Reference persons PIETRO LAFACE

External reference persons Roberto Gemello, Daniele Colibro, Claudio Vair (LOQUENDO)

Research Groups SPEECH RECOGNITION GROUP - SRG

Thesis type SOFTWARE SPERIMENTALE

Description SPEECH RECOGNITION GROUP del Dipartimento di Automatica e Informatica collabora da molti anni con LOQUENDO, azienda leader nelle tecnologie vocali con sede a Torino, esplorando nuove soluzioni tecnologiche e sviluppando algoritmi che aumentino le prestazioni e l'efficienza computazionale dei riconoscitori.
LOQUENDO ha nel suo catalogo un prodotto per il riconoscimento automatico in circa 20 lingue differenti,
progettati per essere utilizzati in un ampio spettro di applicazioni che spazia dal riconoscimento
di parole isolate alla dettatura di referti clinici mediante parlato continuo.

Negli ultimi anni il parlato naturale, in particolare conversazionale, sta attirando l'interesse
scientifico ed aziendale per le sfide che esso pone e per le sue possibili applicazioni che vanno dalla
trascrizione di meeting, alla sottotitolatura di film o passaggi televisivi, l'identificazione dei contenuti multimediali, fino al campo della sicurezza, per esempio per l'identificazione del linguaggio parlato, del parlatore o per la rilevazione di parole chiave sensibili all'interno di una conversazione.

L'obiettivo di questa tesi di laurea è quello di evolvere un sistema di riconoscimento esistente basato
sulla classificazione fonetica mediante reti neurali.
L'evoluzione consiste nella definizione di nuove architetture per le reti neurali, che consentano di modellare con più precisione i fonemi di una lingua pronunciati nell'ambito di una conversazione, catturando contesti temporali molto più grandi di quelli attualmente utilizzati.

Il lavoro di questa tesi, da sviluppare parzialmente o totalmente presso LOQUENDO, con la supervisione continua del relatore, consiste nello sviluppo di moduli software, in linguaggio C, a partire da librerie disponibili, per l'addestramento di modelli fonetici neurali, e nella valutazione sperimentale su uno o più database significativi della bontà delle architetture dei classificatori implementati.

See also  http://www.loquendo.com/it/

Required skills Si richiede una buona capacità di programmazione in linguaggio C e Unix shell

Notes La tesi prevede un rimborso spese per la presenza in Azienda.
Inviare un curriculum ed una copia del piano di studi con le votazioni riportate a pietro.laface@polito.it


Deadline 08/12/2011      PROPONI LA TUA CANDIDATURA




© Politecnico di Torino
Corso Duca degli Abruzzi, 24 - 10129 Torino, ITALY
Contatti