PORTALE DELLA DIDATTICA

Ricerca CERCA
  KEYWORD

SPEECH RECOGNITION GROUP - SRG

Algoritmi per l'addestramento di reti neurali di tipo Deep Belief Network per il riconoscimento del parlatore

Parole chiave DEEP NEURAL NETWORKS, INTELLIGENZA ARTIFICIALE, MACHINE LEARNING, RICONOSCIMENTO DEL PARLATORE

Riferimenti PIETRO LAFACE

Riferimenti esterni Sandro Cumani

Gruppi di ricerca SPEECH RECOGNITION GROUP - SRG

Descrizione La tesi si colloca nell'ambito del riconoscimento automatico del parlatore, cioè dello sviluppo di
tecniche di inferenza statistica basate su algoritmi di machine learning e intelligenza artificiale per
l'identificazione dell'identità del soggetto che ha pronunciato una frase. In particolare la tesi
svilupperà una tematica inserita in un progetto di ricerca finanziato da NUANCE, finalizzato a
combinare metodi per il riconoscimento fonetico con tecniche allo stato dell'arte per la stima del
modello del parlatore.
Il lavoro di tesi consisterà nello sviluppo di tecniche basate su reti neurali per la decodifica fonetica,
in particolare sullo sviluppo di algoritmi di addestramento teacher/student, nei quali modelli
complessi devono essere approssimati con reti neurali di dimensioni ridotte. Il lavoro ha come
obiettivo il miglioramento dell'accuratezza degli attuali sistemi di riconoscimento del parlatore e la
riduzione dei costi computazionali dei modelli.
Il progetto all'interno del quale si pone la tesi, inoltre, permette potenzialmente il coinvolgimento
del candidato in future attività di ricerca.

Vedi anche  algoritmi per l'addestramento di dnn per il riconoscimento del parlatore.pdf 


Scadenza validita proposta 23/02/2020      PROPONI LA TUA CANDIDATURA




© Politecnico di Torino
Corso Duca degli Abruzzi, 24 - 10129 Torino, ITALY
Contatti