Servizi per la didattica
PORTALE DELLA DIDATTICA

Natural Language Processing based on Deep Learning

01GMMIU

A.A. 2022/23

Course Language

Inglese

Degree programme(s)

Doctorate Research in Ingegneria Informatica E Dei Sistemi - Torino

Course structure
Teaching Hours
Lezioni 15
Lecturers
Teacher Status SSD h.Les h.Ex h.Lab h.Tut Years teaching
Cagliero Luca   Professore Associato ING-INF/05 15 0 0 0 1
Co-lectuers
Espandi

Context
SSD CFU Activities Area context
*** N/A ***    
La diffusione di librerie digitali e piattaforme social ha permesso la generazione di un'enorme mole di dati testuali scritti in diverse lingue e disponibili in vari formati. L'analisi dei dati testuali provenienti da contesti applicativi differenti si pone come obiettivo primario l'estrazione automatica di conoscenza utile per analisti ed esperti di dominio. Esempi di conoscenza estratta sono (i) i sommari dei notiziari pubblicati sulle principali testate giornalistiche online, gli abstract di libri, documenti tecnici e regolamenti, (ii) le selezioni di keyword o gruppi di parole semanticamente correlate selezionati da piattaforme social, e (iii) le opinioni e il sentiment di analisti e esperti di dominio. L'obiettivo del corso è introdurre i fondamenti di Natural Language Processing, le tecniche tradizionali di rappresentazione del testo e quelle basate su Neural Network e Deep Learning, le architetture Transformers e le principali applicazioni. Saranno inoltre presentati i principali strumenti opensource a disposizione dei ricercatori per la preparazione e l'analisi dei testi.
The diffusion of digital libraries and social platforms has produced a huge amount of textual data written in different languages, with different styles, and stored in various formats, structured and not. The analysis of textual data coming from heterogeneous application domains has as common objective the automatic extraction of knowledge useful for analysts and domain experts. Examples of extracted knowledge are (i) summaries of news published by different online newspapers and abstracts of scientific books or regulations, (ii) subsets of keywords or groups of “semantically related” terms occurring in textual content published on social platforms, (iii) opinions (sentiment) of analysts and domain experts. The goal of the course is to introduce the fundamentals of Natural Language Processing, the techniques traditionally used to represent textual content and those based on Neural Networks and Deep Learning, the Transformers architectures, and the main applications. The main opensource instruments nowadays available for text preparation and analysis are presented as well.
Fondamenti di data analytics. Per gli studenti che necessitano di integrare le conoscenze base è raccomandato il seguente corso di III livello: 01QTEIU "Data Mining: Concepts and Algorithms".
Data analytics fundamentals. For students who need to acquire basic skills on data analytics and mining the III-level course 01QTEIU "Data Mining: Concepts and Algorithms" is recommended.
- Introduzione al Natural Language Processing - Preparazione del testo - Tecniche tradizionali di rappresentazione del testo - Modelli di word e sentence embedding - Contextualized embeddings e transformers - Applicazioni di Deep NLP - Librerie open source e software per NLP e Deep NLP (ad es. https://huggingface.co/)
- Introduction to Natural Language Processing - Text preparation - Traditional text representations - Word and sentence embeddings - Contextualized embeddings and Transformers - Deep NLP applications - Open-source libraries and software for NLP e Deep NLP (e.g., https://huggingface.co/)
A distanza in modalità sincrona
On line synchronous mode
Presentazione orale
Oral presentation
P.D.2-2 - Luglio
P.D.2-2 - July


© Politecnico di Torino
Corso Duca degli Abruzzi, 24 - 10129 Torino, ITALY
Contatti