Politecnico di Torino | Servizi per la didattica

KEYWORD

Humanoid Sensing and Perception (HSP) Group, Istituto Italiano di Tecnologia

Deep Reinforcement Learning per il Grasping Generalizzato di Oggetti con Mani Robotiche a molti Gradi di Libertà

Parole chiave GRASPING AND DEXTEROUS MANIPULATION, MACHINE LEARNING, REINFORCEMENT LEARNING, ROBOT LEARNING, ROBOTICA, ROBOTICA UMANOIDE

Riferimenti RAFFAELLO CAMORIANO

Riferimenti esterni Lorenzo Natale – Istituto Italiano di Tecnologia, Genova
Elisa Maiettini – Istituto Italiano di Tecnologia, Genova
Federico Ceola – Istituto Italiano di Tecnologia, Genova

Gruppi di ricerca DAUIN - GR-23 - VANDAL - Visual and Multimodal Applied Learning Lab, Humanoid Sensing and Perception (HSP) Group, Istituto Italiano di Tecnologia

Tipo tesi RICERCA, SPERIMENTALE

Descrizione L'obiettivo di questa tesi è di investigare metodi efficienti di Deep Reinforcement Learning (DRL) model-free per l'apprendimento del grasping di molteplici categorie di oggetti con mani robotiche a molti gradi di libertà. In particolare, il candidato indagherà e svilupperà metodi di DRL all'avanguardia per l'addestramento di controllori di grasping multimodali in grado di generalizzare su diverse geometrie degli oggetti, basato solo input visivi 2D e informazioni tattili. L'agente RL sarà addestrato congiuntamente su molteplici categorie di oggetti, esplorando le capacità di vari algoritmi DRL e rappresentazioni multimodali degli oggetti, con un focus specifico sul miglioramento dell'efficienza e della generalizzazione. La piattaforma robotica obiettivo di questo studio è il robot umanoide iCub con la sua mano multi-DoF, che comporta uno spazio d'azione a 20 dimensioni.

Per maggiori dettagli si prega di consultare la descrizione della proposta di tesi allegata (PDF).

Vedi anche rl_icub_grasping_thesis_polito_iit.pdf https://drive.google.com/file/d/1Oiinsrs_9ljlmw5TPFeEg76YVE4yn_p3/view?usp=share_link

Conoscenze richieste - Buona proattività, esperienza di lavoro di squadra e capacità di comunicazione sono necessarie;
- Sono richieste ottime competenze di programmazione e ingegneria del software;
- È richiesta una forte esperienza con Python, preferibilmente con librerie di manipolazione dei dati e di visualizzazione all'avanguardia (ad esempio, PyTorch, OpenAI Gym, RLLib, stable-baselines, mushroom, ...);
- Esperienza o forte motivazione nel lavorare con simulatori robotici (ad esempio Mujoco, Bullet, Gazebo, ...) e potenzialmente con robot umanoidi avanzati sono un plus;
- Esperienza con sistemi di version control del codice (GIT) e software di gestione e visualizzazione degli esperimenti (ad esempio WandB, TensorBoard, ...) è un vantaggio;
- È prevista una conoscenza fondamentale del paradigma di Reinforcement Learning o deve essere acquisita prima dell'inizio della tesi;
- La conoscenza dei fondamenti della robotica e/o esperienza pratica sono un vantaggio.

Note Carico previsto: tempo pieno, minimo 6 mesi, suddiviso in:
- Studio della letteratura - 20%
- Implementazione - 40%
- Esperimenti - 40%

Organizzazione:
- La maggior parte delle attività può essere svolta in modalità ibrida. Il candidato avrà accesso alle strutture del laboratorio VANDAL, con riunioni settimanali di aggiornamento;
- Saranno possibili anche attività in presenza e sessioni di lavoro presso il Center for Robotics and Intelligent Systems dell'Istituto Italiano di Tecnologia a Genova, dove si trovano fisicamente il gruppo di ricerca HSP e il robot iCub. Soggiorni più lunghi sono opzionali e condizionati dalle risorse disponibili e dall'interesse.

Scadenza validita proposta 05/04/2025 PROPONI LA TUA CANDIDATURA