KEYWORD |
LIS 2 Speech: traduzione linguaggio dei segni a testo
Tesi esterna in azienda
Parole chiave MACHINE LEARNING, ARTIFICIAL NEURAL NETWORKS
Riferimenti MAURIZIO MORISIO
Gruppi di ricerca DAUIN - GR-16 - SOFTWARE ENGINEERING GROUP - SOFTENG
Tipo tesi SPERIMENTALE
Descrizione L'idea di base è quella di riconoscere i movimenti propri della lingua italiana dei segni e di
trasformare le sequenze in frasi di senso compiuto in tempo reale.
I gesti riconoscibili saranno stati predeterminati in un dizionario. La generazione di frasi sarà il
risultato intelligente della corretta interpretazione della sequenza di gesti riconosciuti
Il modello di riconoscimento dovrà essere basato su una rete neurale con memoria: LSTM o
GRU a seconda della grandezza e gestione del dataset. Il focus della tesi è proprio la gestione
di una sequenza di immagini in tempo reale, in quanto una versione base del modello è già
stata studiata per gestire i singoli frame.
Il nuovo modello dovrà prendere in input una sequenza di coordinate e restituire in output la
parola registrata. Il risultato ideale è una rete che riconosca non solo la singola parola ma che
capisca il contesto e adatti il significato della stessa attraverso il Natural Language Processing.
Conoscenze richieste JAva, Python, Machine learning
Scadenza validita proposta 24/09/2022
PROPONI LA TUA CANDIDATURA