KEYWORD |
Crawler intelligente per canali Telegram
Parole chiave CYBERSECURITY, MACHINE LEARNING, ARTIFICIAL NEURAL NETWORKS
Riferimenti MARCO MELLIA, LUCA VASSIO
Riferimenti esterni Nikhil Jha
Giordano Paoletti
Gruppi di ricerca DATABASE AND DATA MINING GROUP - DBDM, SmartData@PoliTO, Telecommunication Networks Group
Tipo tesi EXPERIMENTAL
Descrizione Telegram è una piattaforma di chat che offre la possibilità di scambiare messaggi in modo privato. Per questo, malintenzionati abusano della piattaforma per condividere e vendere informazioni illegali, ad esempio dati personali rubati, materiale illegale, ecc.
La tesi si concentra sulla progettazione, ingegnerizzazione e test di un crawler automatico in grado di esplorare canali Telegram, cercare messaggi, estrarre collegamenti ad altri canali e quindi continuare a esplorare il grafico dei canali e degli utenti per automatizzare la raccolta dei dati. L'obiettivo è creare un crawler intelligente in grado di filtrare e dare priorità all'esplorazione di alcuni canali (in base alla lingua, al loro contenuto, alla probabilità di contenere messaggi illeciti, ecc.) per accelerare la velocità di esplorazione e la qualità delle informazioni raccolte. Per questo, utilizzeremo metodologie di machine learning e NLP per definire quale risorsa esplorare.
La seconda parte della tesi si concentrerà sull'analisi dei dati, creando algoritmi di machine learning, graph mining e AI per classificare automaticamente le informazioni, segnalare possibili abusi e supportare il lavoro degli analisti nell'estrarre informazioni preziose dai dati grezzi.
La tesi si baserà su un prototipo di crawler sviluppato dal ricercatore SmartData@PoliTO che attualmente è in grado di eseguire il crawling della piattaforma Telegram in modo scalabile.
Conoscenze richieste - Interest in cyber-security
- Interest in machine learning and AI algorithms
- Good programming skill (Python)
- Good knowledge on machine learning classifiers
Scadenza validita proposta 30/04/2024
PROPONI LA TUA CANDIDATURA