PORTALE DELLA DIDATTICA

Ricerca CERCA
  KEYWORD

Humanoid Sensing and Perception (HSP) Group, Istituto Italiano di Tecnologia

Tesi al Politecnico

Deep Reinforcement Learning per il Grasping Generalizzato di Oggetti con Mani Robotiche a molti Gradi di Libertà

Parole chiave GRASPING AND DEXTEROUS MANIPULATION, MACHINE LEARNING, REINFORCEMENT LEARNING, ROBOT LEARNING, ROBOTICA, ROBOTICA UMANOIDE

Riferimenti RAFFAELLO CAMORIANO

Riferimenti esterni Lorenzo Natale – Istituto Italiano di Tecnologia, Genova
Elisa Maiettini – Istituto Italiano di Tecnologia, Genova
Federico Ceola – Istituto Italiano di Tecnologia, Genova

Gruppi di ricerca DAUIN - GR-23 - VANDAL - Visual and Multimodal Applied Learning Lab, Humanoid Sensing and Perception (HSP) Group, Istituto Italiano di Tecnologia

Tipo tesi RICERCA, SPERIMENTALE

Descrizione L'obiettivo di questa tesi è di investigare metodi efficienti di Deep Reinforcement Learning (DRL) model-free per l'apprendimento del grasping di molteplici categorie di oggetti con mani robotiche a molti gradi di libertà. In particolare, il candidato indagherà e svilupperà metodi di DRL all'avanguardia per l'addestramento di controllori di grasping multimodali in grado di generalizzare su diverse geometrie degli oggetti, basato solo input visivi 2D e informazioni tattili. L'agente RL sarà addestrato congiuntamente su molteplici categorie di oggetti, esplorando le capacità di vari algoritmi DRL e rappresentazioni multimodali degli oggetti, con un focus specifico sul miglioramento dell'efficienza e della generalizzazione. La piattaforma robotica obiettivo di questo studio è il robot umanoide iCub con la sua mano multi-DoF, che comporta uno spazio d'azione a 20 dimensioni.

Per maggiori dettagli si prega di consultare la descrizione della proposta di tesi allegata (PDF).

Vedi anche  rl_icub_grasping_thesis_polito_iit.pdf  https://drive.google.com/file/d/1Oiinsrs_9ljlmw5TPFeEg76YVE4yn_p3/view?usp=share_link

Conoscenze richieste - Buona proattività, esperienza di lavoro di squadra e capacità di comunicazione sono necessarie;
- Sono richieste ottime competenze di programmazione e ingegneria del software;
- È richiesta una forte esperienza con Python, preferibilmente con librerie di manipolazione dei dati e di visualizzazione all'avanguardia (ad esempio, PyTorch, OpenAI Gym, RLLib, stable-baselines, mushroom, ...);
- Esperienza o forte motivazione nel lavorare con simulatori robotici (ad esempio Mujoco, Bullet, Gazebo, ...) e potenzialmente con robot umanoidi avanzati sono un plus;
- Esperienza con sistemi di version control del codice (GIT) e software di gestione e visualizzazione degli esperimenti (ad esempio WandB, TensorBoard, ...) è un vantaggio;
- È prevista una conoscenza fondamentale del paradigma di Reinforcement Learning o deve essere acquisita prima dell'inizio della tesi;
- La conoscenza dei fondamenti della robotica e/o esperienza pratica sono un vantaggio.

Note Carico previsto: tempo pieno, minimo 6 mesi, suddiviso in:
- Studio della letteratura - 20%
- Implementazione - 40%
- Esperimenti - 40%

Organizzazione:
- La maggior parte delle attività può essere svolta in modalità ibrida. Il candidato avrà accesso alle strutture del laboratorio VANDAL, con riunioni settimanali di aggiornamento;
- Saranno possibili anche attività in presenza e sessioni di lavoro presso il Center for Robotics and Intelligent Systems dell'Istituto Italiano di Tecnologia a Genova, dove si trovano fisicamente il gruppo di ricerca HSP e il robot iCub. Soggiorni più lunghi sono opzionali e condizionati dalle risorse disponibili e dall'interesse.


Scadenza validita proposta 05/04/2025      PROPONI LA TUA CANDIDATURA




© Politecnico di Torino
Corso Duca degli Abruzzi, 24 - 10129 Torino, ITALY
Contatti