Riconoscimento oggetti e dati sintetici come nei videogame

Gli appassionati di videogame di ultima generazione sanno bene quanto i paesaggi e gli oggetti rappresentati siano incredibilmente realistici, quasi indistinguibili dalla realtà. I motori grafici dei videogiochi integrano complesse funzionalità per consentire agli sviluppatori di creare esperienze interattive coinvolgenti. Grazie al loro elevato realismo, questi software trovano applicazioni anche al di fuori del mondo ludico, per esempio nella creazione di dati di addestramento per l'intelligenza artificiale.  
Il progetto Ai4 Search and Rescue di TopNetwork è uno di questi casi: è stato utilizzato un motore grafico di un videogioco d'azione per ricreare ambientazioni realistiche. Queste ambientazioni sono state impiegate per addestrare la computer vision dei droni dei Vigili del Fuoco, contribuendo a migliorare l'efficienza nelle operazioni di sorvolo durante situazioni di emergenza. 


I dati sintetici 
 

Secondo la società di consulenza Gartner, quasi tutte le applicazioni entro il 2030 utilizzeranno dati sintetici, cioè informazioni create artificialmente e non a partire da fonti reali.  
Questi dati vengono prodotti tramite algoritmi, modelli statistici o altre tecniche computazionali. L'obiettivo è replicare il comportamento, le caratteristiche e le distribuzioni dei dati reali e sono utilizzati in situazioni in cui la disponibilità di dati reali è limitata, costosa o rischiosa dal punto di vista della privacy.  
I dati sintetici sono importanti perché: 

  • è difficile reperire dati di qualità 
  • la loro generazione è molto veloce 
  • permettono di controllare meglio l’addestramento dell’intelligenza artificiale 

Per allenare l’intelligenza artificiale servono enormi quantità di dati, il più possibile di qualità e senza bias. Avere a disposizione informazioni generate artificialmente e con la possibilità di controllare le singole variabili permette di limitare le distorsioni. 


L’applicazione alla computer vision
 

Durante le operazioni di ricerca e soccorso, i Vigili del Fuoco impiegano droni per acquisire foto e video da sottoporre all'analisi di un team di esperti. Questi specialisti hanno il compito di individuare persone o oggetti all'interno del materiale raccolto.  
TopNetwork ha sviluppato un potente strumento semiautomatico in grado di identificare i target desiderati e metterli in evidenza nelle immagini catturate dai droni. Successivamente, un operatore umano verifica se il target individuato corrisponde a un elemento di interesse. Questo tema è di grande rilevanza poiché ogni volo dei droni, che dura circa 20 minuti, genera tra 600 e 700 immagini. Considerando che una singola missione può durare diverse ore e che gli esseri umani devono analizzare migliaia di materiali in un breve lasso di tempo, l'automatizzazione dell'analisi risulta essenziale.  
TopNetwork ha inizialmente cercato dataset pubblici con riprese aeree effettuate da droni in contesti urbani o boschivi. Purtroppo, i database trovati erano di scarsa qualità o troppo generici, compromettendo l'accuratezza dell'analisi. Invece di ricorrere all'utilizzo delle Generative Adversarial Networks (GAN), un modello di apprendimento automatico in cui due reti neurali si allenano simultaneamente attraverso una sorta di competizione, TopNetwork ha optato per l'impiego del motore grafico di un videogioco. Grazie a estensioni dedicate agli sviluppatori, sono stati simulati gli scenari utilizzati dai Vigili del Fuoco, garantendo un controllo totale sugli elementi da inserire nelle immagini o nei video.  
Grazie a questa soluzione, il modello ha raggiunto un'accuratezza del 96% e sarà oggetto di sperimentazione a livello nazionale in collaborazione con il Corpo dei Vigili del Fuoco a partire dal mese di settembre. 


La sperimentazione con i Vigili del Fuoco
 

I dati sintetici saranno utilizzati come materiale di comparazione: i Vigili del Fuoco acquisiranno e invieranno in tempo reale le immagini delle missioni di ricerca e soccorso. Un software analizzerà il materiale e, se individuerà dei target, manderà un alert a una control room dove presenterà queste immagini a un operatore fisico, che avrà il compito di analizzarle, verificare se effettivamente quel target corrisponde a una persona oppure a un oggetto che potrebbe appartenere a qualcuno. A partire dalle informazioni del drone sarà possibile fornire anche la posizione Gps e quindi individuare in tempo reale dove si trova il potenziale target. 


White-Paper_intelligenza artificiale e riconoscimento immagini e oggetti