KEYWORD |
Web crawling and semantic analysis to support innovation in business
Thesis in external company
Reference persons CLAUDIO GIOVANNI DEMARTINI, FABRIZIO LAMBERTI
Research Groups GR-09 - GRAphics and INtelligent Systems - GRAINS
Description La capacitā di profilazione e classificazione delle aziende in base a offerta, mercati e competenze č uno degli elementi chiave per la valorizzazione di ecosistemi produttivi.
La tesi prevede lo sviluppo di algoritmi di web crawling e analisi semantica di testi per estrazione di contenuti e classificazione automatica del profilo di business a partire dai siti web aziendali.
Struttura tesi
- Stato dell'arte delle tecniche di web crawling e di analisi semantica dei testi
- Analisi di basi dati e fonti informative a disposizione
- Definizione dell'architettura sw di riferimento
- Sviluppo algoritmi di web crawling, analisi testi, estrazione contenuti e classificazione automatica
- Testing degli algoritmi con basi dati reali e valutazione delle prestazioni complessive
La tesi verrā svolta in collaborazione con la Fondazione Torino Wireless.
Deadline 31/12/2019
PROPONI LA TUA CANDIDATURA