PORTALE DELLA DIDATTICA

Ricerca CERCA
  KEYWORD

LIS 2 Speech: traduzione linguaggio dei segni a testo

azienda Tesi esterna in azienda    


Parole chiave MACHINE LEARNING, ARTIFICIAL NEURAL NETWORKS

Riferimenti MAURIZIO MORISIO

Gruppi di ricerca DAUIN - GR-16 - SOFTWARE ENGINEERING GROUP - SOFTENG

Tipo tesi SPERIMENTALE

Descrizione L'idea di base è quella di riconoscere i movimenti propri della lingua italiana dei segni e di
trasformare le sequenze in frasi di senso compiuto in tempo reale.

I gesti riconoscibili saranno stati predeterminati in un dizionario. La generazione di frasi sarà il
risultato intelligente della corretta interpretazione della sequenza di gesti riconosciuti
Il modello di riconoscimento dovrà essere basato su una rete neurale con memoria: LSTM o
GRU a seconda della grandezza e gestione del dataset. Il focus della tesi è proprio la gestione
di una sequenza di immagini in tempo reale, in quanto una versione base del modello è già
stata studiata per gestire i singoli frame.
Il nuovo modello dovrà prendere in input una sequenza di coordinate e restituire in output la
parola registrata. Il risultato ideale è una rete che riconosca non solo la singola parola ma che
capisca il contesto e adatti il significato della stessa attraverso il Natural Language Processing.

Conoscenze richieste JAva, Python, Machine learning


Scadenza validita proposta 24/09/2022      PROPONI LA TUA CANDIDATURA




© Politecnico di Torino
Corso Duca degli Abruzzi, 24 - 10129 Torino, ITALY
Contatti