PORTALE DELLA DIDATTICA

PORTALE DELLA DIDATTICA

PORTALE DELLA DIDATTICA

Elenco notifiche



Natural Language Processing based on Deep Learning

01GMMIU

A.A. 2023/24

Course Language

Inglese

Degree programme(s)

Doctorate Research in Ingegneria Informatica E Dei Sistemi - Torino

Course structure
Teaching Hours
Lezioni 15
Lecturers
Teacher Status SSD h.Les h.Ex h.Lab h.Tut Years teaching
Cagliero Luca   Professore Associato IINF-05/A 15 0 0 0 3
Co-lectures
Espandi

Context
SSD CFU Activities Area context
*** N/A ***    
La diffusione di librerie digitali e piattaforme social ha permesso la generazione di un'enorme mole di dati testuali scritti in diverse lingue e disponibili in vari formati. L'analisi dei dati testuali provenienti da contesti applicativi differenti si pone come obiettivo primario l'estrazione automatica di conoscenza utile per analisti ed esperti di dominio. Esempi di conoscenza estratta sono (i) i sommari dei notiziari pubblicati sulle principali testate giornalistiche online, gli abstract di libri, documenti tecnici e regolamenti, (ii) le selezioni di keyword o gruppi di parole semanticamente correlate selezionati da piattaforme social, e (iii) le opinioni e il sentiment di analisti e esperti di dominio. L'obiettivo del corso è introdurre i fondamenti di Natural Language Processing, le tecniche tradizionali di rappresentazione del testo e quelle basate su Neural Network e Deep Learning, le architetture Transformers e i recenti sviluppi ottenuti attraverso i Large Language Models. Saranno inoltre presentati i principali strumenti opensource a disposizione dei ricercatori per la preparazione e l'analisi dei testi.
The diffusion of digital libraries and social platforms has produced a huge amount of textual data written in different languages, with different styles, and stored in various formats, structured and not. The analysis of textual data coming from heterogeneous application domains has as common objective the automatic extraction of knowledge useful for analysts and domain experts. Examples of extracted knowledge are (i) summaries of news published by different online newspapers and abstracts of scientific books or regulations, (ii) subsets of keywords or groups of “semantically related” terms occurring in textual content published on social platforms, (iii) opinions (sentiment) of analysts and domain experts. The goal of the course is to introduce the fundamentals of Natural Language Processing, the techniques traditionally used to represent textual content and those based on Neural Networks and Deep Learning, the Transformers architectures, and the latest advances achieved by Large Language Models. The main opensource instruments nowadays available for text preparation and analysis are presented as well.
Fondamenti di data mining. Per gli studenti che necessitano di integrare le conoscenze base è raccomandato il seguente corso di III livello: 01QTEIU "Data Mining: Concepts and Algorithms".
Data mining fundamentals. For students who need to acquire basic skills on data analytics and mining the III-level course 01QTEIU "Data Mining: Concepts and Algorithms" is recommended.
- Introduzione al Natural Language Processing - Preparazione del testo - Tecniche di embedding - L'architettuea Transformer - Librerie open source e software per NLP e Deep NLP (ad es. https://huggingface.co/) - Large Language Models
- Introduction to Natural Language Processing - Text preparation - Embedding techniques - Transformers architecture - Open-source libraries and software for NLP e Deep NLP (e.g., https://huggingface.co/) - Large Language Models
In presenza
On site
Presentazione orale
Oral presentation
P.D.2-2 - Maggio
P.D.2-2 - May