KEYWORD |
Crypto Antifraud Bitcoin transaction analysis with Machine learning
Parole chiave BITCOIN, CRIPTOVALUTE, MACHINE LEARNING, ARTIFICIAL NEURAL NETWORKS, MACHINE LEARNING, DEEP LEARNING, OTTIMIZZAZIONE, PYTHON
Riferimenti EROS GIAN ALESSANDRO PASERO, VINCENZO RANDAZZO
Riferimenti esterni La tesi viene fatta in collaborazione con un'azienda
Gruppi di ricerca Neuronics (Artificial Neural Networks)
Tipo tesi AZIENDALE, SPERIMENTALE APPLICATA
Descrizione L'obiettivo principale di questo progetto è sviluppare un servizio predittivo attraverso l'applicazione di AI/ML che analizzi i modelli transazionali di conti correnti Bitcoin per accertare se questi siano potenzialmente fraudolenti.
L'obiettivo principale è contrassegnare un indirizzo come dannoso prima che venga segnalato dai siti che ricevono segnalazioni e accuse di frode, al fine di proteggere preventivamente gli utenti della comunità. Dato l'obiettivo di utilizzare una tecnica di apprendimento supervisionato per la classificazione degli indirizzi Bitcoin, verrà fornito un database di transazioni etichettate (lecite e illecite), come campione rappresentativo della popolazione reale.
Per effettuare il riconoscimento di pattern all'interno di un conto corrente verranno utilizzate differenti reti neurali, in base allo specifico caso d'uso. Verranno confrontate le prestazioni di vari modelli di machine learning, concentrandosi su parametri chiave quali: l'efficienza computazionale, il tempo di addestramento, e la velocità di inferenza.
Verranno estratte molte features per addestrare un modello utile per le previsioni, tra cui:
- Statistiche delle transazioni: numero totale di transazioni, transazioni in entrata e in uscita.
- Statistiche delle somme: calcolato sia in BTC che in dollari USA, tenendo conto del valore di mercato di BTC al momento della transazione. Verranno calcolati il valore massimo, minimo, medio e mediano dell'importo totale inviato e ricevuto da ciascun indirizzo, nonché un intervallo e un rapporto.
- Statistiche temporali: statistiche sulla distanza temporale tra transazioni consecutive effettuate dallo stesso indirizzo.
- Statistiche avanzate: indicatori complessi basati sulla teoria dei segnali.
Verranno addestrati diversi modelli di machine learning, ad es. Regressione logistica, XGBoost e deep learning. Esistono numerosi modi per mettere a punto questi modelli, come la selezione delle features (ad esempio, rimuovendo le funzionalità di BTC per evitare l'influenza delle fluttuazioni dei prezzi di mercato) o le previsioni medie, per bilanciare le prestazioni del modello.
Per garantire l'integrazione e la scalabilità del modello nel nostro ecosistema software, richiediamo che il modello di rete neurale finale venga fornito in un formato standardizzato (ad esempio, .h5, .pb, .pt o .pth), selezionato in base alla compatibilità con le nostre piattaforme. Sarà inoltre necessaria una documentazione dettagliata del modello, illustrando le tecniche di addestramento utilizzate e le architetture di rete scelte, per facilitare l'interpretazione dei risultati e l'eventuale iterazione del modello.
Conoscenze richieste passione per il lavoro di tesi. se avete comptenze di reti neurali, deep learning e finanza può essere utile. altrimenti forniremo noi tutto il materiale
Note La tesi viene fatta in collaborazione con un'azienda
Scadenza validita proposta 21/02/2025
PROPONI LA TUA CANDIDATURA