IBM Research. Un nuovo set di dati chiamato Diversity in Faces
IBM Research rilascerà un nuovo set di dati inedito chiamato Diversity in Faces (DiF) per promuovere uno studio più corretto ed accurato nell’ambito della tecnologia di riconoscimento facciale.
• Un set ampio e diversificato che contiene 1 milione di immagini con annotazioni utili ad aiutare la comunità scientifica a rilevare, riconoscere e analizzare meglio le immagini dei volti.
• Usando immagini, pubblicamente disponibili, del set Creative Commons YFCC-100M, IBM ha codificato le immagini usando 10 schemi di codifica ben stabiliti e indipendenti, tra cui craniofacciale (ad esempio, lunghezza della testa, lunghezza del naso, altezza della fronte), rapporti facciali (simmetria), visiva attributi (età, genere) e posa e risoluzione, oltre ad altri.
I VOLTI
I volti umani presenti in tutto il mondo sono molto differenti tra loro. Lo studio efficace della diversità di volti per la tecnologia di riconoscimento facciale è quindi molto complesso e deve andare ben oltre gli attributi tipici studiati come età, sesso e colore della pelle. Simmetria facciale, contornatura, distanza tra il naso e la fronte sono tutti attributi aggiuntivi che costituiscono la diversità nei nostri volti.
La ricerca condotta da IBM contribuirà ad ampliare la conoscenza in materia. Il set di dati DiF, Diversity in Faces, è quindi un punto di partenza utile perché la ricerca globale possa studiare e sviluppare una soluzione di intelligenza artificiale più corretta ed accurata.
Molti dei recenti progressi nell’IA hanno prodotto notevoli capacità per i computer di svolgere compiti sempre più sofisticati e importanti, come la traduzione di parole per le comunicazioni tra culture e migliorare così le interazioni complesse tra persone e macchine o riconoscere automaticamente i contenuti dei video.
INTELLIGENZA ARTIFICIALE
Gran parte della forza dell’intelligenza artificiale oggi deriva dall’uso dell’apprendimento diretto basato sui dati per formare modelli sempre più accurati utilizzando quantità crescenti di dati. Tuttavia, la forza di queste tecniche può anche essere una debolezza. I sistemi di intelligenza artificiale apprendono ciò che viene insegnato e, se non vengono insegnati con set di dati solidi e diversificati, l’accuratezza e l’equità potrebbero essere a rischio. Per questo motivo, IBM, insieme agli sviluppatori di IA e alla comunità di ricerca, deve riflettere su quali dati utilizziamo per la formazione.
La sfida nell’allenamento dell’IA si manifesta in modo molto apparente e profondo con la tecnologia del riconoscimento facciale. Oggi, ci possono essere difficoltà nel realizzare sistemi di riconoscimento facciale che soddisfino le aspettative di correttezza. Il cuore del problema non è la tecnologia AI, di per sé, ma il modo in cui i sistemi di riconoscimento facciale automatizzati dall’IA vengono addestrati. Affinché i sistemi di riconoscimento facciale si comportino come desiderato – e i risultati diventino sempre più accurati – i dati per l’addestramento devono essere diversi e offrire un’ampia copertura. Ad esempio, i set di dati devono essere sufficientemente ampi e abbastanza diversi da consentire alla tecnologia di apprendere tutti i modi in cui i volti si presentano per riconoscere con precisione le differenze in una varietà di situazioni. Le immagini devono riflettere la distribuzione delle caratteristiche nei volti che vediamo nel mondo.
LA MISURAZIONE
Come misura IBM a diversità per i volti umani? Si inizia con il modo in cui i volti differiscono per età, sesso e colore della pelle e in che modo i volti diversi possono variare in alcune di queste dimensioni. Gran parte della messa a fuoco sulla tecnologia di riconoscimento facciale è basata su questi attributi. Ma, come hanno dimostrato studi precedenti, questi attributi sono solo una parte del puzzle e non del tutto adeguati per caratterizzare l’ampia diversità dei volti umani. Sono importanti anche le dimensioni come la simmetria del volto, il contrasto facciale, la posa del viso, la lunghezza o la larghezza delle caratteristiche del viso (occhi, naso, fronte, ecc.).
DIVERSITY IN FACES
Oggi IBM Research sta rilasciando un nuovo ampio e diversificato set di dati chiamato Diversity in Faces (DiF) per promuovere lo studio della correttezza e dell’accuratezza nella tecnologia di riconoscimento facciale. Il primo set è disponibile per la comunità di ricerca: DiF fornisce una serie di annotazioni di 1 milione di immagini facciali umane. Usando immagini pubblicamente disponibili dal set di dati Creative Commons YFCC-100M, si procede con 10 schemi di codifica ben stabiliti e indipendenti dalla letteratura scientifica. Gli schemi di codifica includono principalmente misure oggettive di facce umane, come caratteristiche craniofacciali (ad es. grandezza della testa, lunghezza del naso, altezza della fronte), oltre a annotazioni più soggettive, come la stima dell’età e l’indicazione del sesso con procedura manuale. Rilasciando queste annotazioni del sistema di codifica facciale su un ampio set di dati (1 milione di immagini di volti) IBM contribuisce ad accelerare lo studio della diversità e della copertura dei dati per i sistemi di riconoscimento facciale AI per garantire sistemi IA più equi e accurati. La versione di oggi è semplicemente il primo passo.
Il set di dati DiF fornisce una distribuzione più equilibrata e una copertura più ampia delle immagini facciali rispetto ai set di dati precedenti. Inoltre, le intuizioni ottenute dall’analisi statistica dei 10 schemi di codifica iniziali sull’insieme di dati DiF hanno favorito la comprensione di ciò che è importante per la caratterizzazione dei volti umani e hanno permesso di continuare ricerche importanti su come migliorare la tecnologia di riconoscimento facciale.
Links:
- a questo link si possono scaricare i visual asset (immagini e un breve video), oltre al post originale sullo studio:
- tramite questo il link si accede al sito IBM dedicato: https://www.research.ibm.com/artificial-intelligence/trusted-ai/diversity-in-faces/?social