Cesare Lombroso rivive nell’esperimento di Ibm. Big Blue, tramite la propria divisione di ricerca, ha rilasciato un database inedito di immagini di visi umani, chiamato Diversity in Faces (Dif), allo scopo di promuovere uno sviluppo più accurato delle tecnologie di riconoscimento facciale. Il set contiene un milione di foto pubbliche, con licenza Creative Commons Yfcc-100m, già catalogate utilizzando dieci schemi di codifica, fra cui parametri craniofacciali (lunghezza della testa,e del naso, altezza della fronte), rapporti facciali (simmetria), attributi visivi (età, genere), posa e risoluzione. Il database contiene inoltre annotazioni utili per la comunità scientifica. “La forza principale dell’intelligenza artificiale proviene dall’utilizzo del deep learning per allenare modelli sempre più accurati, utilizzando un quantitativo di dati in costante crescita”, ha spiegato in un blog post John R. Smith, Ibm Fellow.

“Ma questa forza può tramutarsi anche in una debolezza. I sistemi di Ai imparano in base a quello che viene loro insegnato. Se non si ricorre a dataset robusti e differenziati, l’accuratezza e l’imparzialità potrebbero essere in pericolo”, ha aggiunto Smith. “Per questo motivo Ibm, insieme a sviluppatori impegnati nel campo dell’intelligenza artificiale e alla comunità di ricercatori, ha deciso di muoversi cautamente e di scegliere con cura quali informazioni utilizzare in fase di addestramento”.

Le prime analisi di Ibm sull’insieme di immagini hanno dimostrato che il dataset fornisce una distribuzione più bilanciata e una copertura maggiore di foto di visi, rispetto a strumenti precedenti. Inoltre, i riscontri ottenuti dall’analisi statistica dei primi dieci schemi di codifica hanno permesso ai ricercatori di approfondire la conoscenza su quali elementi siano più importanti nella caratterizzazione del volto umani. Per accedere al database è necessario seguire la procedura illustrata a questa pagina.