Simulare la visione umana con tecnologie di Computer Vision è una nuova frontiera dell’intelligenza artificiale (IA), grazie ai numerosi progetti che mirano a utilizzare la Computer Vision per migliorare la sicurezza e integrare/sostituire l’intervento umano in diverse attività. Pensiamo anche a una delle principali sfide future che interessa la visione artificiale: la guida autonoma dei veicoli, che presuppone lo sviluppo di sistemi di riconoscimento immagini sempre più evoluti e integrati con la capacità di comprensione dell’ambiente umano.
Per capire come una macchina possa riconoscere gli oggetti all’interno di immagini e riprese video, conviene partire dalla definizione di intelligenza artificiale: l’insieme di sistemi hardware e software che mirano a replicare alcune capacità tipiche dell’essere umano, come la capacità di percepire l’ambiente e interagire con esso. L’IA, inoltre, è in grado di perseguire in modo autonomo un obiettivo definito, prendendo decisioni per supportare (o sostituire) l’intervento umano.
Così i sistemi di Computer Vision sfruttano i sensori ottici di videocamere, fotocamere e altri dispositivi per effettuare riconoscimenti di persone e oggetti; alla base della visione artificiale c’è la progettazione di reti neurali stratificate che permettono alla Computer Vision di sviluppare processi di apprendimento caratteristici del cervello umano.
In altre parole, è come se l’IA fosse dotata di organi di senso (la vista in questo caso) e di un sistema nervoso e cerebrale per acquisire, analizzare, elaborare dati e informazioni attraverso una capacità percettiva.
Ecco perché si utilizza l’espressione “deep learning”, che possiamo tradurre in apprendimento profondo, complesso: bisogna insegnare alla rete neurale a elaborare grandi quantità di dati con specifici algoritmi, finché il sistema di Computer Vision sarà in grado di svolgere determinati compiti in autonomia, basandosi sulle sue esperienze passate.
Ad esempio, si può addestrare un software di Computer Vision a riconoscere forme, colori, pattern, distinguere oggetti, seguire i loro spostamenti nello spazio e ricavare informazioni dagli schemi visivi che osserva.
Con il deep learning, l’IA impara anche a fornire possibili correlazioni tra dati ed eventi in apparenza scollegati tra loro, facendo così emergere nuove informazioni utili per svariate attività, ad esempio la manutenzione predittiva degli impianti industriali.
La manutenzione predittiva, infatti, è ampiamente basata sulla capacità di “leggere” i dati che riguardano il funzionamento dei macchinari, allo scopo di predire la probabilità che avvenga un guasto o una rottura e così intervenire tempestivamente con la riparazione-sostituzione.
L’addestramento, quindi, migliora continuamente le prestazioni dell’intelligenza artificiale in funzione dell’esperienza e del tipo di elaborazione dati; il risultato è un sistema di Computer Vision capace di adattare e specializzare le sue “risposte” in base al contesto in cui opera.
I campi di applicazione della computer vision sono numerosi anche fuori dal contesto industriale e produttivo, proprio grazie al livello di capacità raggiunto dai sistemi di oggi. Ecco alcuni esempi:
Classificazione delle immagini: i modelli di computer vision oggi possono essere utilizzati per riconoscere diversi elementi all’interno di un’immagine, per esempio oggetti o animali, ma anche volti di persone specifiche.
Tracciamento: estensione della classificazione e rilevamento, il tracciamento permette di seguire gli spostamenti di un elemento riconosciuto una volta identificato
Stima della posa: la capacità di riconoscere posizione e spostamento degli oggetti in una immagine può essere usato sia a scopo identificativo sia, per esempio, per implementare sistemi di comando basati sui gesti.
Riconoscimento ottico dei caratteri (OCR): probabilmente la più antica forma di computer vision, permette la conversione delle immagini che contengono testo in file di testo veri e propri.
Si tratta in ogni caso di un campo in rapida e continua evoluzione: al crescere della potenza di calcolo disponibile, le possibili applicazioni si fanno sempre più evolute e articolate.
Vediamo di seguito le principali applicazioni di Computer Vision, con particolare attenzione alle applicazioni per il business delle aziende in diversi settori.
Uno degli utilizzi più diffusi della Computer Vision nelle industrie è il rilevamento di errori o difetti di fabbricazione: ad esempio, la visione artificiale può riconoscere le imperfezioni dei prodotti su una linea di produzione con velocità e precisione impensabili per l’occhio umano; ciò permette di eliminare gli scarti e ottimizzare i processi manifatturieri, abbassando i costi dei controlli qualità effettuati con personale umano specializzato.
Opportunamente equipaggiati con termo-camere, sensori multispettrali e sistemi di rilevamento oggetti, i droni possono compiere in totale autonomia diverse attività potenzialmente pericolose per le persone. Alcuni esempi: ispezioni a impianti e infrastrutture come ponti, tralicci, cavalcavia, soprattutto se tali infrastrutture sono esposte a rischi ambientali (frane, caduta di alberi); monitoraggio di condotti e cisterne per individuare sversamenti oleosi e-o di sostanze tossiche; ispezioni in ambienti contaminati. Grazie all’intelligenza artificiale, i droni possono contribuire alle strategie di manutenzione predittiva raccogliendo dati sul campo e analizzando-collegando tra loro questi dati, in modo da capire in anticipo se un impianto è prossimo a un guasto.
Qui entrano in gioco diverse tecnologie come telecamere con sistemi di Computer Vision, robot, sensori installati sugli scaffali. Nei magazzini completamente automatizzati, l’intelligenza artificiale può analizzare le sequenze operative (movimentazione e posizionamento delle merci) allo scopo di organizzare nel modo più efficiente tutti i processi all’interno dei magazzini stessi. E mediante l’analisi comportamentale, l’IA può rilevare in real-time eventuali errori o azioni non autorizzate del personale umano, inviando notifiche e allarmi.
Tra le possibili applicazioni della Computer Vision per la sicurezza “intelligente” nei vari luoghi pubblici-privati ricordiamo: rilevare oggetti incustoditi in stazioni, aeroporti, stadi, centri commerciali; rilevare la presenza di armi o altri oggetti che possono costituire una minaccia per l’incolumità fisica delle persone (coltelli, spranghe e così via); riconoscere gesti e comportamenti potenzialmente pericolosi con sistemi di riconoscimento facciale, addestrati a rilevare i tratti biometrici che corrispondono a certe reazioni emotive, come rabbia e aggressività.
La visione artificiale può essere molto utile per ridurre il rischio di incidenti nei luoghi di lavoro, soprattutto nei cantieri edili. Con soluzioni di Computer Vision, infatti, è possibile verificare che gli addetti dei cantieri eseguano correttamente le azioni previste dalle procedure di sicurezza, come indossare dispositivi individuali di protezione (caschi, guanti) o disinfettare tute e attrezzature contaminate da sostanze tossiche. L’intelligenza artificiale può rilevare situazioni di potenziale pericolo per tecnici e operai, come il passaggio di carichi sospesi; inoltre, può controllare gli accessi dei veicoli e delle persone nelle diverse aree di cantiere, evitando gli ingressi non autorizzati nelle zone con specifiche restrizioni.
Si possono implementare videocamere con sistemi di Computer Vision (riconoscimento oggetti, analisi dei movimenti) direttamente sui lampioni led che compongono una rete elettrica digitale di ultima generazione, una smart grid. Così l’impianto per l’illuminazione pubblica si trasforma in una piattaforma di servizi integrati, come la videosorveglianza e l’autoregolazione dei flussi luminosi in base al numero di veicoli e persone presenti in un dato momento.
Secondo le ultime stime di GlobalData, la Computer Vision raggiungerà un volume di mercato su scala mondiale pari a 28 miliardi di dollari nel 2030 (3,5 miliardi nel 2019), sulla scia delle nuove applicazioni di questa tecnologia in svariati settori industriali, tramite lo sviluppo di reti neurali artificiali sempre più complesse e performanti.
Intanto anche in Italia sta crescendo il mercato annuale dell’IA, che nel 2019, in base alla ricerca pubblicata a febbraio 2020 dall’Osservatorio Artificial Intelligence - School of Management del Politecnico di Milano, ha toccato 200 milioni di euro tra software, hardware e servizi; banche, imprese manifatturiere, utility e assicurazioni sono i settori dove l’intelligenza artificiale è più diffusa nel nostro paese.
In cima al mercato italiano dell’IA, spiega il Politecnico di Milano, ci sono le soluzioni di Intelligent Data Processing, che utilizzano algoritmi per l’analisi dei dati e l’estrazione delle informazioni dai dati (33% del mercato complessivo), seguite dalle soluzioni di Natural Language Processing e di Chatbot/Assistente Virtuale (28% del totale), che impiegano algoritmi capaci di comprendere il linguaggio umano e fornire risposte a un interlocutore.
La Computer Vision, secondo la ricerca dell’Osservatorio Artificial Intelligence, nel 2019 ha rappresentato il 10% del mercato italiano dell’intelligenza artificiale, anche se finora solo una percentuale limitata di progetti (3%) è arrivata alla piena operatività nelle aziende; si attende, evidenzia il Politecnico milanese, “un grande sviluppo nel prossimo futuro grazie alla sempre più performante capacità d’indagine” della visione artificiale in diversi contesti, come la sorveglianza in luoghi pubblici o il monitoraggio delle linee di produzione.