30/11/2009 di Redazione

Riconoscimento facciale, tecnologia a portata di mano

Cinque software per il tagging facciale delle foto da Apple, Google, Microsoft, Cyberlink e Face.com.

immagine.jpg

Introduzione

Fino a non molto tempo il riconoscimento facciale aveva a che fare con procedure per approssimazione. Si scattava qualche foto di un soggetto, la si passava per il software, a la volta successiva il programma era in grado di riconoscere la persone, più o meno. I moderni programmi per "taggare" le persone sono altrettanto semplici, o almeno così ci si aspetterebbe. Abbiamo preso un bel po' di fotografie per metterli alla prova. Abbiamo scoperto che queste applicazioni hanno raggiunto un buon livello di qualità, e possono, effettivamente, facilitare molto la gestione di grandi quantità di fotografie. 

Per chi ha migliaia di fotografie di famiglia si tratta di uno strumento eccezionale, incredibilmente utile e praticamente insostituibile. Le etichette (tag), non sono una soluzione definitiva, ma l'evoluzione di questa tecnologia è stata molto veloce, e tutti si aspettano grandi cose.

La realtà delle cose, però, non è proprio così. Queste applicazioni possono effettivamente essere molto utili, ma usarle al meglio non è semplice, e probabilmente dovrete dedicarci molto più tempo di quello che pensate, se volete ottenere il risultato perfetto che immaginate.

Con questo articolo speriamo di capire quanto è grande lo sforzo necessario per avere un po' più d'ordine nelle proprie collezioni d'immagini, e se il gioco vale la candela.

Ognuna delle cinque applicazioni che abbiamo provato è relativamente nuova, un paio nuovissime, e si prestano perfettamente ad una competizione testa a testa.

Apple iPhoto '09

I nuovi Mac vengono venduti complete di iPhoto '09, il programma di fotoritocco di Apple. Questa applicazione meriterebbe una recensione a parte, ma per ora basterà dire che la nuova versione presenta la novità "Faces and places", come elemento più rilevante. Quanto ai luoghi, iPhoto può gestire i dati GPS forniti dall'iPhone per integrarli nei metadati dell'immagine, così sarà facile sapere dove è stata scattata, oltre che quando.

La funzione permette, di integrare le immagini in una mappa, con una visualizzazione moderna e gradevole. Se non avete un iPhone, potete cliccare sulla piccola "i" sotto ad ogni immagine, e usare Google Maps per selezionare la locazione migliore.

Per quanto questa funzione non abbia nulla a che vedere con il l'etichettatura dei volti, può essere di grande aiuto quando si fanno ricerche tra molte fotografie.

La funzione Volti di iPhoto è invece meno ovvia. Importare il nostro album di prova, che contiene 300 file, ha richiesto 44 secondi, quindi possiamo dire che è stato molto veloce. Questo passaggio, però, non include l'analisi dei volti. iPhoto importa le immagini e ne fa un'analisi preliminare, ma si limita a cercare volti in generale, non specifici. La maggior parte del lavoro viene lasciato all'utente, come vedremo.

Provando questi programmi abbiamo capito un concetto semplice: la potenza di calcolo, per questa funzione, non conta molto. Ad oggi la tecnologia ci offre un'affidabilità dell'80% nel riconoscimento di un volto, che è un gran passo avanti rispetto al 30% che avevamo anni fa, ma siamo ancora di fronte a limiti enormi, come nella conversione voce-testo, dove una precisione del 95% è sufficiente a rendere quasi inutile lo strumento, per via del lungo tempo necessario a correggere quel 5% di errori nel testo risultate. Il riconoscimento dei volti, quindi, sarà davvero utile quando funzionerà alla perfezione. Speriamo che non manchi molto.

Il processo di correzione successivo, infatti, è un lungo lavoro manuale, che può essere davvero molto frustrante, e potrebbe far rinunciare anche il più paziente di noi.

Apple, a prima vista, sembra aver preso in maggior considerazione questi problemi. La funzione Volti di iPhoto fa un uso intenso degli input dati dall'utente, che decide se l'interpretazione del programma è corretta o meno. L'utente "istruisce" l'applicazione all'inizio del processo di analisi, nella speranza che queste impostazioni iniziali servano ad evitare il lungo e noioso lavoro di modifica a posteriori.

Il risultato desiderato, per tutti, è di avere fotografie taggate con precisione, e secondo i nostri desideri. L'analisi iniziale, però, non può offrircelo, e inevitabilmente dovremo investire più tempo del previsto in questa attività. Vista la grande quantità di tempo che dovremo passare usando l'applicazione scelta, è evidente che l'interfaccia utente assume un'importanza determinante, perché è con quella che lavorerete.

Apple iPhoto '09: primi passaggi

La prima cosa da fare è importare le immagini nella libreria, un processo automatico se, per esempio, la fonte è una scheda SD. iPhoto, per qualche ragione, non ha riconosciuto le due immagini in scala di grigi che avevamo inserito, anche se non ha problemi con le immagini in bianco e nero e formato RGB.

Le immagini importate formano un nuovo Evento, sul quale si deve cliccare per vederle e gestirle. Abbiamo scelto la prima, con quattro persone, per dare inizio all'attività di riconoscimento. Basta cliccare sul tasto "Nome" e l'applicazione (si spera) mostra una finestra accanto ad ogni volto, all'interno della quale scrivere il nome della persona, per poi cliccare su "Fine" a cose fatte.

A questo punto bisogna cliccare su "Volti" nella barra a sinistra, per continuare con la procedura. Fate doppio click su un miniatura per raggiungere una nuova schermata, che sarà occupata dall'immagine selezionata, in centro, e, con un po' di fortuna, da una serie di immagini con lo stesso volto, nella parte sottostante. Nel nostro caso abbiamo ottenuto otto immagini suggerite, sei delle quali ritraevano la persona giusta. Con un click singolo si accetta l'immagine proposta, mentre uno doppio equivale ad un rifiuto.

Apple iPhoto '09, facce corrucciate

L'idea è che mano a mano che l'utente dà conferme, iPhoto conosce sempre meglio i volti e le persone, trova sempre più corrispondenze corrette e produce sempre meno errori. Questo sistema è molto utile se avete molte fotografie della stessa persona, e se le immagini sono chiare.

La tecnologia sviluppata da Apple, però, non fa miracoli, così come quelle degli altri produttori. Le corrispondenze ottenute sono state molto poche e, una volta esauriti i quattro soggetti di test, abbiamo notato che iPhoto ha prodotto una "prima ondata" di corrispondenze in buona parte valide, nel giro di un minuto, ma dopo le prime conferme da parte nostra non abbiamo notato miglioramenti, come ci aspettavamo.

In breve vi troverete, come noi, a scoprire che iPhoto trova solo una manciata di foto corrispondenti a un volto, anche se nella vostra collezione ce ne sono centinaia. Una volta raggiunto questo punto, quindi, non resta che lavorare a mano sulle immagini rimanenti, e legare nomi e volti uno alla volta.

Apple, per fortuna, ha inserito una funzione che ricorda i nomi più utilizzati, così basterà digitare le prime lettere e poi selezionare quello desiderato. Resta il fatto che bisogna fare la stessa cosa per ogni immagine che l'applicazione non riesce a riconoscere automaticamente.

Apple iPhoto '09: facce divertenti

Ci sono diversi aspetti che emergono quando iPhoto non riconosce un volto, o quando riconosce un oggetto come se fosse una persone. In qualche occasione, per esempio, ha riconosciuto come volti delle mani, gambe, orecchie o altri elementi. Come potete vedere dall'immagine, in un caso ha riconosciuto la ruota di un'auto come se fosse una persona, ma non il ragazzo inquadrato.

In questo caso bisogna passare con il mouse sulla finestra di dialogo e chiuderla a mano, ed eliminare l'etichetta, per evitare che resti segnato come "sconosciuto". Se invece il tag manca perché iPhoto non ha riconosciuto un volto, bisogna premere il pulsante "Aggiungi Volto Mancante", che mostra una finestra di selezione al centro dell'immagine. Basta spostare e ridimensionare il riquadro di selezione intorno ad un volto, scrivere il nome, e andare avanti. Se il nome è nuovo, si aggiungerà alla lista di quelli esistenti.

Ci abbiamo messo 37 minuti per completare il lavoro con iPhoto, dall'importazione delle 300 immagini all'ultimo tag. Una volta finito avevamo una lista completa di etichette per tutte e quattro le persone incluse nella collezione, senza omissioni. Il risultato finale era eccellente, ma abbiamo dovuto fare tutto a mano. Il motore di riconoscimento di Apple si è rivelato utile per iniziare il lavoro, ma abbiamo dovuto mettere a mano il 50% dei nomi, e circa un quarto dei volti non è stato riconosciuto, e lo abbiamo creato manualmente.

iPhoto, analisi sintetica

I risultati che abbiamo ottenuto non sono certo quelli che ci saremmo aspettati. Quasi immediatamente l'eccitazione per la novità è scomparsa, e l'etichettatura è diventata un lavoro vero e proprio. Non vogliamo condannare iPhoto per questo, ma piuttosto guardiamo con rassegnazione allo stato di questa tecnologia che, visti i limiti attuali, non è ancora pronta per la diffusione di massa.

Apple, anzi, ha fatto un buon lavoro con l'interfaccia utente, che è semplice e intuitiva, e colloca questo prodotto un po' più avanti degli altri.

iPhoto '09, giudizio finale

I progettisti di Apple hanno messo in mostra tutta la loro esperienza. Sapevano, evidentemente, che il riconoscimento volti di iPhoto non è un granché, e così hanno sviluppato un'interfaccia avanzata e funzionale, in modo da compensare il difetto. L'obiettivo, centrato, era quello di rendere la procedura di tagging più veloce e comoda per l'utente. In questo caso possiamo dire che l'interfaccia utente fa la differenza. Aggiungete il fatto che Apple è stata tra le prime aziende, se non la prima, ad inserire nel suo prodotto questa funzione, e il giudizio finale su iPhoto non può che essere molto buono.

CyberLink MediaShow 5

CyberLink è un nome conosciuto e apprezzato nel campo del software, e negli ultimi tempi si è affermata anche per il software che usa la GPU. L'azienda ha, infatti, applicazioni video capaci di sfruttare le schede video Nvidia e ATI per migliorare le prestazioni video, e scaricare allo stesso tempo la CPU. Il recente MediaShow 5 (39.99 euro) è la proposta Cyberlink per modificare e correggere velocemente foto e video, e supporta l'accelerazione GPU con CUDA per diverse funzioni, una delle quali è il riconoscimento dei volti. Parleremo dei dettagli di quest'applicazione in un prossimo articolo, e per ora ci limiteremo agli aspetti inerenti al riconoscimento facciale. Abbiamo solo voluto far sapere agli utenti Nvidia che con questo software possono ottenere qualche cosa in più, in termini di prestazioni, grazie alla loro scheda grafica. Non è un dettaglio da poco, soprattutto se dovete elaborare migliaia di immagini.

Al primo avvio di MediaShow 5 avrete di fronte una "parete" di miniature, che potrete scorrere ed esplorare, creata a partire dalla libreria multimediale. A sinistra troverete lo spazio per lavorare, e cliccandoci si arriva alla Libreria, alla quale potrete, eventualmente, aggiungere nuovi elementi e cartelle. In fondo a sinistra c'è un'icona dinamica, che indica la scansione del computer: aspettate che quest'attività sia terminata, e che tutte le immagini siano state registrate dal programma, altrimenti vi troverete a lavorare solo con una parte della vostra collezione di fotografie.

Nella libreria, a sinistra, troverete la cartella selezionata, che dovrete cliccare per vedere le miniature delle immagini che contiene nella finestra principale. A questo punto bisogna cliccare il pulsante "Etichetta volti"; si apre una finestra di dialogo per farvi decidere come procedere. Probabilmente vorrete taggare tutte le fotografie esistenti, come abbiamo deciso di fare noi.

MediaShow 5, carico pesante

Abbiamo provato tutte queste applicazioni, eccetto iPhoto, su un sistema Windows 7 con CPU AMD Phenom II X4 955, con 4 GB di RAM e un sistema grafico composta da una HD4550 e una 4650.

Come quasi tutte le applicazioni di questo genere, quella di Cyberlink occupa tutte le risorse che trova disponibili per eseguire quanto prima i lavori richiesti. Come potete vedere la nostra CPU è stata occupata fino al 100%, nel momento in cui MediaShow comincia la sua analisi. Con un carico così intenso il sistema, come potete immaginare, diventa praticamente inutilizzabile. Tenetelo presente, nel caso voleste lasciare l'analisi in background e usare il computer per qualche altra attività.

Media Show se l'è cavata bene con la nostra cartella di prova, e ha fallito solo con il file TIF. A parte quest'unico file, il resto della cartella è stato analizzato in poco più di cinque minuti. A differenza di iPhoto, Media Show tenta di ottenere di più dal suo motore di riconoscimento, mettendo insieme molte fotografie e raggruppandole per volto.

MediaShow non segue l'esempio di iPhoto; qui non c'è un campo vuoto che l'utente deve riempire con il nome delle persone. Per etichettare i volti dovrete passare alla visualizzazione "Pending" (in sospeso) nella scheda Riconosci Volti, dove vedrete raccolte di immagini che, secondo il programma, ritraggono la stessa persona. Nella nostra collezione i due ragazzi sono i volti più ricorrenti, e MediaShow ha fatto del suo meglio per raccogliere le foto in cui sono presenti, e inserirle tra le fotografie "in sospeso", cioè in attesa di approvazione da parte dell'utente.

Prendiamo per esempio 25 volti in sospeso. Controllandoli, scoprite che appartengono tutti alla stessa persona. Basta selezionarle, con il tasto in alto a sinistra, e digitare il nome della persona, ed ecco che tutte e 25 le immagini sono state etichettate con il nome corretto. Il sistema funziona abbastanza bene, quindi potreste riuscire a taggare centinaia d'immagini in pochi minuti. Se in un gruppo trovate un'immagine che non dovrebbe esserci, è sufficiente deselezionarla per evitare di associarla al nome sbagliato. Ci sembra un approccio molto intelligente, che lascia iPhoto molti indietro e mette in risalto l'ottimo motore di CyberLink.

MediaShow 5, Interfaccia

Nessuno, purtroppo, riesce a fare un prodotto perfetto al primo colpo. Il primo tentativo di CyberLink nel campo del riconoscimento facciale non è perfetto, e può essere migliorato in diversi aspetti. Abbiamo sentito direttamente l'azienda, sottoponendo ad un loro esperto i nostri primi risultati, che ha trovato "strano" il fatto che i gruppi generati dal programma contenessero così poche immagini. In effetti il gruppo d' immagini simili più numeroso che abbiamo ottenuto era composto di sole quattro fotografie.

Il nostro contatto ci ha garantito di aver fatto test in collaborazione con Nvidia e altri, con risultati molto migliori. Forse dipende dalla qualità delle immagini? La nostra collezione include immagini prese con un telefono cellulare, a 1.3 MP, e altre ad alta definizione, scattate con una compatta di buona qualità. Una varietà che simula bene una collezione di fotografie di famiglia, e che possiamo considerare un campione attendibile. 

Quando si avvia la funzione di riconoscimento di MediaShow ogni gruppo è sovrastato da tre pulsanti: Seleziona (per aggiungere un nome ad un intero gruppo), Salta (rinvia l'aggiunta di un tag) e Rimuovi (elimina la finestra di etichettatura dalle immagini selezionate). Quando si comincia ad aggiungere nomi, MediaShow aggiunge altri tre bottoni, utili per aggiungere i nomi usati di recente. Se il programma individua una corrispondenza, evidenzierà in blu il nome suggerito per un volto ancora da etichettare, selezionato tra quelli già memorizzati.

La cosa curiosa è che per quanto ingrandiate la finestra, anche a tutto schermi i bottoni disponibili per i nomi sono sempre tre al massimo. Se volete inserire un nome che non è fra i tre prescelti, dovrete andarlo a prendere nel menù a tendina. L'interfaccia utente di MediaShow mostra tanti gruppi quanti è possibile inserirne nella finestra, sfruttando appieno lo spazio verticale, e la limitazione a tre bottoni sembra strana, anche perché in orizzontale resta dello spazio che si poteva sfruttare.

A proposito di spazio, non siamo riusciti ad estendere MediaShow su due schermi. Non è una cosa che interessa a molti, ma può essere una seccatura per chi ci è abituato.

MediaShow 5, punti critici

Sopra alla finestra "In Sospeso" ci sono due bottoni: "Apply Default" (Applica Predefiniti) e "Skip All" (Salta tutto). Se i quattro gruppi a schermo contengono tutti un riconoscimento è corretto, cliccando su "Apply Default" MediaShow applicherà il nome selezionato a tutte le immagini raccolte nei gruppi. In linea di principio questa è una funzione eccezionale, capace di farci risparmiare moltissimo tempo. In verità, però, non ci è mai capitata l'occasione di usarla.

Il pulsante "Skip All" funziona in modo molto simile, ma serve quando tutti i riconoscimenti proposti sono sbagliati.  Questi due bottoni, quindi, sono utili in funzione della precisione nel riconoscere i volti di MediaShow, ma presentano anche un potenziale problema, legato proprio al modo in cui il programma decide di mostrare i risultati.

Potete vedere che MediaShow mostra quattro gruppi di associazioni. Nella barra "Pending", in basso a destra, c'è il primo volto di ogni gruppo, e comprende anche i gruppi successivi ai quattro mostrati. Il sesto volto, relativo al sesto gruppo, appartiene alla stessa persona del quarto e del terzo, ma non è possibile unirli e taggarli in un colpo solo. La stessa cosa vale per la rimozione o il tasto Salta, non c'è modo per fare la stessa azione su più di un gruppo alla volta.

Ogni volta che si preme su un bottone, poi, l'applicazione impiega qualche secondo, due o tre, per completare l'attività richiesta. Non è molto, ma se lo moltiplicate per molti gruppi, i tempi si possono dilatare più del dovuto. Sarebbe stato più sensato espandere la barra delle attività in sospeso, e permettere all'utente di accumulare più azioni programmate, per poi avviarle ed eseguirle tutte insieme. Con questa soluzione, tra l'altro, i bottoni "Apply Default" e "Skip All" perderebbero molta della loro apparente potenza.

L'aspetto più critico, tuttavia, per noi riguarda il bottone in alto a destra, "Regroup" (Riassegna). Può capitare, in effetti, che col passare del tempo ci si trovi con diversi volti privi di associazioni, cioè senza nome, come conseguenza di azioni svolte, volontariamente o no, durante l'uso dell'applicazione. MediaShow, in teoria, "impara" mano a mano che lo si usa, e dovrebbe diventare sempre più abile nel riconoscere i volti che appaiono con più frequenza, ma la realtà si è mostrata ben diversa: i gruppi, almeno nel nostro caso, erano sempre molto piccoli, e l'accuratezza del riconoscimento è sempre quella.

MediaShow 5, analisi sintetica

Cyberlink è arrivata a un passo dal dare vita ad un software semplicemente incredibile, ma purtroppo non ci è riuscita. Gli elementi necessari ci sono tutti, ma non sono stati uniti in modo armonico, e il risultato ha dei difetti rilevanti. Il processo di identificazione manuale è praticamente identico a quello di iPhoto, così come i "falsi positivi", quali il riconoscimento di un volto dove in verità c'è una mano.

Ci sono voluti 5 minuti per l'analisi iniziale, e altri 25 per il primo ciclo d'identificazione, che ha visto gruppi per la maggior parte composti di una sola fotografia. Conoscendo meglio le funzioni di MediaShow, probabilmente avremmo potuto risparmiare qualche minuto, ma la prima volta che si usa un'applicazione difficilmente si ottengono i risultati migliori.

Il passaggio successivo, sistemare a mano i dettagli che il programma non ha potuto risolvere, ha portato via altri 24 minuti. Questa parte è, di fatto, un buco nero per il tempo, pieno di click superflui e ritardi dovuti ad una UI mal progettata, per quanto riguarda le attività ripetitive. Sembra che CyberLink abbia concentrato tutti i suoi sforzi sul raggruppamento d'immagini, e abbia copiato Apple per il resto, e per questo in MediaShow ritroviamo gli stessi difetti di design di iPhoto, senza i vantaggi. Ogni click fa perdere uno o due secondi, e alla lunga diventa snervante.

Il lavoro con MediaShow, a causa dell'ultimo passaggio, ha richiesto un totale di 54 minuti, molto più dei 37 richiesti da iPhoto.

Diamo a CyberLink il beneficio del dubbio sull'accuratezza dell'analisi, perché altri utenti hanno avuto risultati diversi, e molto migliori dei nostri. Forse la nostra collezione d'immagini ha qualche caratteristica che mette in difficoltà MediaShow, e dopotutto la precisione che abbiamo visto al primo passaggio sarebbe più che accettabile, se fosse abbinata ad un'interfaccia più flessibile, che permettesse la gestione di più gruppi in un colpo solo.

L'interfaccia utente di MediaShow 5 è decisamente il suo collo di bottiglia, non certo la velocità dell'analisi. CyberLink, quindi, è molto vicina alla versione definitiva di quest'applicazione, che non vediamo l'ora di provare.

In generale MediaShow 5 è un'applicazione valida, che merita un giudizio positivo. Più la userete, e più diventerà efficace e facile da usare. Da un punto di vista comparativo, però, non possiamo evitare di rilevare che molto del suo potenziale resta inespresso, un fatto che impedisce a MediaShow 5 di finire nel campo dell'eccellenza.

Face.com Photo Tagger

Facebook è diventato il sito di condivisione d'immagini più usato del mondo, con miliardi d'immagini ospitate. Trattandosi si una piattaforma dotata di API, potete installare applicazioni anche su Facebook, e fare molte cose, tra le quali l'etichettatura delle fotografie. Non potrete agire sulla vostra intera collezione, naturalmente, ma solo su quelle che avete caricato sul social network: in certi casi, però, quella online sarà l'unica collezione che v'interessa etichettare, e per questo Photo Tagger è interessante.

Face.com è certamente uno dei servizi più insoliti nei quali ci siamo mai imbattuti, ed è allo stesso tempo interessante e spaventoso. Ci siamo arrivati partendo da Facebook che, come probabilmente saprete, permette di etichettare le persone che compaiono in una fotografia: per farlo dovete selezionare un visto alla volta, e inserire manualmente il nome della persone. Photo Tagger, invece, riconosce i volti automaticamente, e vi lascia solo il compito di inserire i nomi.

Una volta installata l'applicazione sulla vostra pagina di Facebook, dovrete poi darle i permessi necessari, e cominciare ad utilizzarla, caricando uno dei vostri album. L'applicazione esamina le fotografie, che si trovano sui server di Facebook, e quindi questa operazione non ha nessun impatto sul vostro sistema. Questo aspetto, per alcuni, può essere determinante, perché lascia il computer libero da qualsiasi carico, e all'utente la possibilità di usare il proprio PC mentre PhotoTagger fa il proprio lavoro.

L'analisi, in ogni caso, è velocissima. Non abbiamo potuto fare una stima esatta del tempo impiegato perché Facebook impone un limite di 200 fotografie per album, ma abbiamo potuto stimare che per analizzare un teorico album da 300 fotografia impiegherebbe 3 minuti e dieci secondi. Photo Tagger analizza un album ogni volta che lo si apre, per pochi secondi, per verificare a analizzare gli eventuali nuovi elementi.

Una volta che l'album è stato completamente analizzato, vedrete risultati simili a quelli dell'immagine:

Photo Tagger, accuratezza

Come altre applicazioni simili, Photo Tagger raggruppa le immagini in gruppi, per somiglianza. Anche in questo caso, i due ragazzi sono i soggetti che compaiono più spesso, e quindi appaiono nel primo gruppo. In alto a destra potete notare che Photo Tagger ha contato quanti volti, secondo la prima analisi, compaiono nelle fotografie, quante sono da taggare e la percentuale di lavoro completata, che indica quanti volti sono stati identificati fino ad un dato momento. È un modo sottile di spingere l'utente a finire il lavoro, che potrebbe rivelarsi efficace.

L'accuratezza di Photo Tagger, a prima vista, ci ha impressionato. Nei primi gruppi, 23 dei 24 volti identificati appartenevano effettivamente alla stessa persona, un risultato che oscura quelli di iPhoto e MediaShow. Il secondo gruppo ha totalizzato 10 su 13, un altro buon risultato.

Il primo ragazzo appare in un totale di 62 fotografie, e Photo Tagger è riuscito a identificarne 23 al primo passaggio. Il secondo, invece, è stato riconosciuto 10 volte su 59. Non è facile capire come funziona Photo Tagger nelle fasi successive: in un gruppo il tema comune era "ragazzi con occhiali da sole", in un altro sembrava che fosse "primi piani con espressioni vuote e un po' fuori fuoco". Photo Tagger, curiosamente, ha finito con le fotografie dei ragazzi prima di passare a quelle degli adulti. Apparentemente, quindi, questa applicazione produce risultati basandosi su un proprio algoritmo di affidabilità e sul numero di immagini corrispondenti.  

Photo Tagger, il processo di etichettatura

Le procedure seguite da Photo Taggere sono piuttosto semplici. Se tutte le facce di un gruppo appartengono effettivamente alla stessa persona, basta cliccare il link "tagga", a sinistra del gruppo, scrivere il nome della persona e premere invio. Al principio, però, i gruppi offerti dall'applicazione non saranno accurati al 100%, e ci vorrà un po' di lavoro manuale per raffinare i risultati: sotto ad ogni volto, in basso a destra, c'è un riquadro blu con un circolo bianco che con click permette d'inserire un nome per la persona indicata. Quest'ultima azione crea un nuovo gruppo con il nome appena inserito, se questo è nuovo, oppure potete decidere di rimuovere il volto da un gruppo, spostandolo nella categoria dei non assegnati.

Le immagini non assegnate nel nostro caso costituivano un gruppo piuttosto numeroso, di diverse dozzine di volti, e secondo noi molti di queste erano abbastanza chiare da essere riconosciute senza problemi dal software. Photo Tagger, d'altra parte, ha uno svantaggio rispetto agli altri software, e cioè il fatto che le immagini caricate su Facebook sono ridimensionate a 604x453 e 72 dpi, circa un quarto di megapixel. Anche Photo Tagger non si è dimostrato preciso come  i suoi concorrenti, quindi, merita comunque attenzione, visto il tipo d'immagini che elabora, per non parlare del fatto che la sua interfaccia è comunque migliore di quella predefinita di Facebook, e più facile da usare.

Manca un checkbox per i propri amici, ma Photo Tagger e la cava molto bene con il completamento automatico dei nomi, almeno di quelli che sono amici sul social network. Per gli altri, invece, bisogna scrivere sempre il nome per intero, almeno la prima volta. 

L'area dei volti non assegnati sarebbe più utile se offrisse la possibilità di selezionare e applicare un tag ad una selezione. La mancanza di questa funzione è, probabilmente, il maggior difetto di questa applicazione per Facebook: l'unica alternativa che abbiamo trovato è stata incollare di continuo i nomi delle persone che Photo Tagger non è riuscita a riconoscere. Se, con un po' di fortuna, la persona non riconosciuta è tra i vostri amici, potete usare la funzione di auto completamento per velocizzare questa parte, ma i ritardi dovuti alla connessione rendono più veloce e comodo premere Ctrl-V.

In generale Photo Tagger ha funzionato bene tra il 30 e il 50% delle volte, il che lo rende uno dei peggiori software di questo articolo, come può lasciare intendere il fatto che ha associato una donna con un albero, come si vede dall'immagine.

Anche in questo caso, quindi, una volta che l'applicazione ha fatto il suo lavoro, dovrete finire con un certosino lavoro manuale. Mediamente , taggare una fotografia con Photo Tagger richiede tra i 10 e i 15 secondi, parte dei quali se ne vanno in caricamenti.

Il tempo totale, con Photo Tagger, è arrivato a circa 80 minuti, un risultato che mette in risalto come le web applications richiedano tempi più lunghi, come contraltare ai vantaggi che offrono.

Photo Tagger, simbiosi con Photo Finder

Una volta che tutte le vostro fotografie su Facebook sono taggate e organizzate il lavoro è finito, ma c'è ancora un punto del quale vale la pena parlare. Face.com ha anche un'altra applicazione, Photo Finder. Anche quest'ultima, almeno per ora, è accessibile solo su invito.

Tra partecipanti è possibile fare una scansione degli album degli altri, alla ricerca di immagini dove appariamo noi e i nostri amici, che siano taggati o meno. Ogni volta che viene caricata una nuova immagine, l'applicazione l'aggiunge ai risultati, creando, potenzialmente, un archivio esteso e incredibilmente completo. Lo abbiamo provato per poco, e l'unico errore è stato dovuto ad un vero e proprio inganno, generato da amici che avevano volutamente taggato male alcune fotografie. Il software di Face.com, di fatto, non ha creato errori, nella nostra prova limitata.

L'obiettivo di Photo Finder è, chiaramente, quello di avere sempre informazioni aggiornate su alcuni amici, e in particolare su sé stessi. È molto utile, soprattutto per chi ha molti amici ed è iscritto a molte pagine, e di conseguenza si troverà un homepage molto ricca di contenuti in continuo cambiamento, con un'elevata probabilità di perdere alcune notifiche importanti.

Se poi qualche vostro amico posta una fotografia che vi ritrae in luoghi, posizioni o compagnie imbarazzanti è probabile che vorrete saperlo quanto prima, dandovi la possibilità di rimuovere il tag, e magari di evitare disastri con amici e parenti.

Questi software, d'altra parte, sono solo il primo passo. In futuro sarà possibile tenere sotto controllo un numero sempre maggiore d'informazioni su sempre più persone. La maggior parte di noi ha poca o nessuna attenzione alla privacy, in particolare su social network, e l'evoluzione di queste applicazioni potrebbe rappresentare un rischio serio.

Face.com specifica con molta chiarezza i propri impegni per quanto riguarda la riservatezza, ma nulla garantisce che la prossima azienda farà lo stesso. Le etichette legate alle fotografie, inoltre, hanno un formato proprietario, quindi non c'è un consorzio o un gruppo che ne possa controllare l'uso, imponendo alle aziende un qualche tipo di limite.

Per questo abbiamo cominciato a parlare di face.com definendolo "spaventoso". Una volta che si permette ad un'applicazione di accedere ai dati personali, infatti, le permettiamo di riconoscere il nostro volto, praticamente diffondendolo in giro per la rete? Non ancora, ma solo perché questi strumenti sono ancora grezzi e in via di sviluppo.

Photo Tagger: analisi sintetica

Abbiamo esaminato l'accuratezza di Photo Tagger e l'abbiamo messa a confronto con gli altri software, scoprendo che non è comparabile con le applicazioni desktop. Tenendo presente, però, che quest'applicazione lavora con immagini a bassa risoluzione, e questo gli conferisce un qualche valore in più. Anche la velocità dell'analisi è molto buona, ed infatti solo MediaShow, con accelerazione CUDA, può fare meglio. Quanto alla facilità d'uso Photo Tagger non fa molto bene: l'applicazione è persino troppo semplice, ma forse è perché Face.com deve adattarla ai limiti dell'infrastruttura di Facebook, in particolare a quelli del linguaggio Java, entrambi elementi fuori dal controllo dello sviluppatore.

Photo Tagger non è particolarmente innovativa perché, dal punto di vista dell'utente finale, non è che un'altra applicazione per etichettare le fotografia, e fa quello che ci si aspetterebbe da lei.

Face.com vuole chiaramente seguire la direzione dei social media, e ci sembra che sia molto ben organizzata ed efficace, forse persino troppo. Ecco la parte preoccupante: che succede se si scatta una fotografia di uno sconosciuto, si va su Facebook, e c'è un'applicazione per sapere chi è, se è single o meno, che lavoro fa? I datori di lavoro potrebbero indagare sui loro dipendenti con ancora più precisione di quella attuale, i genitori potrebbero tenere sotto stretto controllo i figli, e chissà cos'altro.

Per quanto possa non piacere, o persino spaventare, questa è la strada dell'innovazione, e per questo aspetto Face.com merita il massimo dei voti.

Come altre applicazioni, infine, Photo Tagger è in grado di "imparare", come ha fatto notare l'amministratore dell'azienda Gil Hirsch: "Photo Tagger migliora mano a mano che le persone lo usano. Raccoglie e analizza le informazioni di cui è in possesso per migliorare i risultati. Quindi, in effetti, i primi album danno risultati elementari, in media, ma le nostre statistiche mostrano che con utenti Facebook con una media di 170 amici, i risultati migliorano in fretta".

Google Picasa 3.5

Google, come Facebook, ha in sé un potenziale preoccupante, dovuto alla quantità di dati personali che può maneggiare. Google offre numerosi servizi, e ha milioni di utenti in tutto il mondo, e nella maggior parte dei casi è tutto gratis. Nella vita, si sa, nulla è davvero gratis, quindi dovremmo essere preoccupati di quale sia il prezzo che paghiamo, o pagheremo, a Google, e del perché non lo conosciamo. O forse è semplice paranoia.

Picasa 3.5 è l'ultima versione del software di gestione fotografica di Google, e ha recentemente acquistato la capacità di riconoscere ed etichettare i volti. Una volta scaricato e installato, Picasa esegue una scansione dell'intero sistema, alla ricerca di immagini da aggiungere alla libreria. Successivamente, potrete decidere di sostituire il visualizzatore immagini di Windows con quello di Picasa. Noi abbiamo deciso di non farlo, perché non era pertinente con questo articolo, ma è sempre possibile modificare questa scelta.

Dopo l'installazione e la scansione del sistema, potrete accedere all'applicazione, ed eventualmente aggiungere una cartella specifica, come abbiamo fatto noi con la nostra cartella di prova. Basta premere il pulsante "Importa", e selezionare la cartella che desiderate. È possibile scegliere solo alcune fotografie, oppure importare tutta la cartella, che è stata la nostra scelta.

Notate che Picasa organizza file e cartelle in base alla data di creazione, ma anche quest'impostazione può essere modificata. L'importazione della nostra cartella, con 300 file, nella libreria ha richiesto 1 minuto e 10 secondi, e subito dopo si può cominciare a cercare volti.

L'analisi della cartella ci ha sorpreso per il lungo tempo che ha impiegato, ben 17 minuti. Va detto anche che il carico della CPU non ha mai superato il 70%, quindi è possibile lasciare Picasa in background e continuare ad usare il computer, anche se a prestazioni ridotte. Alla fine della prima analisi, Picasa aveva individuato 485 volti.

Picasa, il gioco dei nomi

Tenete presente che Picasa è una delle poche applicazioni che permette di regolare la sensibilità del sistema di scansione volti. Noi abbiamo tenuto le impostazioni standard, ma potete modificarle andare in Strumenti>Opzioni, dove troverete le due voci relative.

Abbiamo portato in evidenza i volti non riconosciuti, che sono raccolti in una galleria. Per ognuna delle quattro persone principali, abbiamo scelto una fotografia diretta e con una buona messa a fuoco come modello, per vedere come Picasa riconosceva gli altri. Aggiungere un nome ad un volto fa apparire una finestra di dialogo, nella quale potrete anche inserire i dati di contatto della persona in questione. Per fare in fretta e non alterare il test, noi ci siamo limitati al nome di battesimo, e siamo passati velocemente al nome successivo.

Se, invece, avete già quella persona tra i contatti, potete aggiungerla selezionando il suo nome del menù di scelta rapida.

A questo punto potevamo già fare una prima valutazione. Per tre dei nostri quattro soggetti Picasa ha rilevato solo volti esatti, mentre per il quarto l'accuratezza si è fermata "solo" al 92%. Non c'erano molte immagini riconosciute, ma 67 su 69 erano già associate correttamente. Un risultato sorprendente.

Quando si clicca, poi, sulla X rossa per segnalare che un volto non corrisponde al nome proposto, Picasa tenta subito di legarlo ad un altro volto, e di solito al secondo tentativo trova l'associazione giusta.  Picasa ha eccezionali capacità di apprendimento, tanto che in circa 15 secondi abbiamo etichettato correttamente circa 53 delle 117 fotografie dove appare uno dei ragazzi.

Se assegnate ad un'immagine l'etichetta sbagliata, poi, è facile mettervi riparo. Basta prendere l'immagine taggata male, e trascinarla sotto al nome giusto, e tutto si sistema.

Picasa, solo un cane di troppo

Etichettare le immagini dei nostri quattro soggetti ha richiesto circa un minuto, a abbiamo anche aggiunto 112 etichette corrette. A questo punto, però, avevamo fatto solo il 23% del lavoro. Siamo tornati alla lista dei volti non identificati, che a questo punto ne conteneva 373: è possibile selezionare dei volti e ignorarli tutti insieme, ma non si risparmia molto tempo rispetto all'esclusione di un volto alla volta. Non appena un gruppo di sconosciuti viene eliminato un altro lo sostituisce, e il movimento è piuttosto veloce. Il menù di scelta rapida è sempre presente, e i suggerimenti sono sempre più numerosi, perché includono, oltre ai contatti, i nomi che sono stati aggiunti in precedenza.

Mano a mano che si procede Picasa tenta di assegnare i volti ad una delle persone presenti, e quindi accanto al nome vedrete una piccola icona arancione con un punto di domanda, a segnalare che l'applicazione ha dei suggerimenti su quella persona. È possibile abbandonare la lista dei volti non assegnati, controllare i suggerimenti, approvarli (sono quasi sempre corretti), e tornare alla lista, ma noi abbiamo preferito evitare questo movimento oscillatorio. Il tempo necessario, in ogni caso, è simile.

A differenza dei prodotti concorrenti, Picasa non ha generato errori, riconoscendo oggetti che non erano volti. È capitato con un cane, ma in nessun altro caso. Picasa, inoltre, ha riconosciuto più volti delle altre applicazioni.

Sono passati 12 minuti da quanto abbiamo inserito il primo nome a quanto abbiamo esaurito la lista di volti non riconosciuti. Una volta finita la procedura assistita, restava ancora un po' di lavoro manuale da fare.

La modifica manuale, con Picasa, passa per la funzione di fotoritocco. Passando sopra ad un volto con il mouse compare la finestra di dialogo per inserire il nome. A destra trovano spazio le miniature delle persone già etichettate, che potete sfruttare come uno strumento di scelta rapida, se è possibile.

Picasa - Add a Tag 2

Quando trovate un'immagine senza etichette, basta premere sul tasto "Aggiungi Manualmente", selezionare il volto con il mouse e inserire il nome.

Dall'inizio alla fine la modifica manuale ha richiesto 15 minuti.

Picasa, analisi sintetica

A questo punto possiamo dire di aver finito, con nove etichette in più rispetto a MediaShow. Picasa ha faticato con le immagini molto angolate, e ha funzionato molto male con le immagini ruotate di 90 gradi, che dovrete raddrizzare prima dell'analisi. A parte questi dettagli, ha funzionato benissimo.

Se avete un account Google, poi, potete caricare le fotografie su un album Web, sfruttando il servizio Web Album di Picasa, sul quale il tagging dovrà essere abilitato. Per ogni album, inoltre, è anche possibile specificare diversi livelli di riservatezza, ridimensionare automaticamente le immagini e aggiungere un watermark.

Picasa ottiene risultati eccezionali nell'analisi di volti ed etichette perché preferisce lasciare un volto come "Non Assegnato", piuttosto che incorrere in errori con associazioni sbagliate. È anche molto efficace nel distinguere i volti umani, infatti l'unico errore è stato il cane.

Picasa può essere preso come punto di riferimento per la tecnologia di riconoscimento facciale, ma purtroppo per fare tutto ci sono voluti ben 45 minuti, un tempo lunghissimo, in gran parte dovuto all'analisi iniziale, che per fortuna si è rivelata molto precisa. Durante l'analisi, d'altra parte, potrete continuare ad usare il PC, a prestazioni ridotte, quindi il problema non è particolarmente rilevante.

Picasa è facile da usare, e l'integrazione tra le sue funzioni e gli album online è di ottimo livello. Come iPhoto, infine, Picasa è gratuito, e solo per questo Cyberlink ha ragione di preoccuparsi.

Se scegliete Picasa e vi appassiona, e bene sapere in anticipo che il servizio di archiviazione e condivisione online è gratuito solo fino ad 1 GB. Se avete bisogno di più spazio, 10 GB vi costeranno 75 dollari l'anno, mentre per 40 GB ce ne vorranno 75. Noi ci siamo concentrati sull'applicazione per desktop, ma qualcuno potrebbe essere interessato ad usare la funzione di tagging anche online, con alcune piccole differenze.

Microsoft Windows Live Photo Gallery

Microsoft è consapevole che il cloud computing è il futuro. Al momento non si nota una gran fretta per portare gli utenti "nella nuvola", ma di certo tutti stanno preparando il terreno. Microsoft, nel dettaglio, sta giocando le sue carte con Xbox Live e Microsoft Live Apps, nel quale rientra Photo Gallery che, in un certo senso, è ciò che avrebbe dovuto essere Paint. Windows Live Photogallery, chiaramente, è anche la risposta di Microsoft a Picasa, soprattutto perché anche questa applicazione è gratuita.   

Dopo l'installazione abbiamo importato la nostra cartella di prova. Basta cliccare su File>Aggiungi Cartella alla galleria, per inserire i nuovi file. Alcune immagini appaiono molto più velocemente di altre, ma non sappiamo esattamente perché. In ogni caso l'analisi iniziale ha richiesto 11 minuti.

Microsoft ha ottenuto buoni risultati nel riconoscimenti dei volti, anche se non eccezionali. Gli errori sono stati pochi, come quello mostrato nell'immagine.

Photo Gallery, però, in 11 minuti ha individuato solo 210 volti, perdendo completamento le inquadrature angolate, o quelle non complete (coperte parzialmente da un oggetto). La selezione sembra arbitraria, e ci siamo ritrovati con molte fotografie dove appaiono due persone nelle quali è stato riconosciuto un solo volto, e in molti casi si trattava di quella che secondo noi, era meno chiara. Nella fotografia che vi mostriamo, potete vedere che l'applicazione Microsoft ha riconosciuto un volto, ma non quello senza occhiali da sole né quello meglio illuminato, come ci saremmo aspettati. Come iPhoto, in questa immagine è stato riconosciuto l'unico volto che non era inclinato.  Sembrerebbe quasi che dietro a queste applicazioni ci sia un unico fornitore di software; il sospetto, almeno, sembra legittimo. WLPG: via con i  nomi

Live Photo Gallery, via con i nomi

Live Photo Gallery integrava già delle etichette del proprietario delle immagini, ottenute dall'account Windows live, che abbiamo dovuto inserire per scaricare l'applicazione. Si possono aggiungere nuove etichette con il pulsante "Aggiungi", che si trasforma in "Inserisci qui un nome". Dopo averlo inserito, basta premere Invio ed il nuovo nome compare nella lista "Altre persone".

Abbiamo quindi cominciato inserendo i nomi di cui avevamo bisogno. Microsoft Live Photo Gallery, a differenza delle altre applicazioni, non fa nessuno sforzo per associare nomi e immagini. Dopo aver visto, con le altre applicazioni, che comunque vada bisogna investire del tempo per finire manualmente il lavoro, forse Microsoft ha pensato di tagliare la testa al toro, e passare direttamente al lavoro manuale. O forse hanno un prodotto in cantiere che non è ancora perfetto, e preferiscono non farlo vedere a nessuno, prima che sia il momento giusto, chi lo sa?

Comunque la mettiate, abbiamo dovuto etichettare manualmente 300 scatti. Se l'applicazione ha individuato il volto, basta scrivere il nome, selezionandolo dalla lista creata in precedenza, oppure aggiungendo una nuova voce. Se Photo Gallery, invece, non ha riconosciuto un volto, invece, dovrete aggiungerlo manualmente, cliccando sul collegamento "Tag someone" a destra, e poi usare il puntatore che compare per selezionare il volto da aggiungere.

WLPG: etichettatura, giro gratis

L'unico problema evidente che abbiamo notato nell'interfaccia di Photo Gallery è che bisogna sempre premere sul pulsante Back (Indietro) per selezionare l'immagine successiva. Come potete immaginare questa impostazione porta a perdere il conto dei click totali. Tornare alla galleria, d'altra parte, permette di tenere sotto controllo le miniature, che nel nostro caso si è rivelato utile per saltare velocemente gruppi d'immagini che non c'interessavano. Anche se si ci si "perde", tornare alla galleria permette di riprendere il lavoro agilmente, perché con un colpo d'occhio potrete vedere quante e quali persone avete già etichettato. Come in Picasa, è possibile scegliere miniature più grandi, con il comando a scorrimento in basso a destra.

Il metodo scelto da Microsoft, in effetti, non è niente male. Difficilmente abbiamo dovuto spendere più di dieci secondi per ogni immagine, e inserire un nuova etichetta è veloce quasi quanto sceglierne una di quelle esistenti. Se ci sono due persone in un'immagine, e una è già riconosciuta, etichettate quella per prima. Successivamente appare automaticamente il puntatore per aggiungere un volto, e basta un click per aggiungere il secondo tag. Il numero di click necessari è lo stesso che avremmo se anche il secondo volto fosse stato riconosciuto: un sistema eccellente.

Con un'immagine abbiamo commesso un errore, applicando il tag sbagliato. Tentando di correggere, però, ci siamo ritrovati con una doppia etichetta. Non è stato un gran problema: è bastato tornare alla lista delle Persone e cliccare la X accanto al nome da eliminare, e confermare l'azione nella finestra di dialogo che compare.

Dopo 19 minuti avevamo 33 etichette per la persona n°1, 88 per la seconda, 75 per la terza e 36 per la quarta, chiaramente molto meno di quanto abbiamo ottenuto con le altre applicazioni. Abbiamo quindi dovuto fare un altro passaggio, controllando nuovamente le immagini, per scoprire che avevamo etichettato solo i volti che Photo Gallery aveva riconosciuto, mentre tutti gli altri erano rimasti intoccati. Abbiamo finito il lavoro a mano, in 36 minuti.

WLPG, analisi sintetica

Il secondo passaggio di etichettatura manuale ci ha deluso, e mette in luce alcuni aspetti negativi di WLPG. 47 minuti in totale, inoltre, non è un risultato eccezionale, e dimostra ancora una volta, se ce ne fosse bisogno, che questo tipo di programmi funziona combinando automatismi e intervento dell'utente, ma mai senza che quest'ultimo debba fare parte del lavoro a mano. Live Photo Gallery ha un approccio tradizionale a quest'attività, che alla fine si paga. L'interfaccia è leggera e semplice, e include anche funzioni di fotoritocco molto utile. Ma Google, per quanto riguarda almeno il riconoscimento e l'etichettatura, batte Microsoft nettamente.

Conclusioni

Abbiamo esaminato la funzioni di tagging dei volti come se fosse un nuovo tipo di applicazione, anche se è, e sarà, un funzione integrata nei programmi per la gestione delle fotografie. Possiamo già vedere, tuttavia, quali compagnie faranno meglio per aiutare gli utenti a trasformare i loro dati in elementi di socialità online. Presto, di certo, faranno la loro comparsa le etichette nei video, che sarà certamente una sfida più difficile.

L'analisi iniziale è probabilmente l'aspetto ancora più grezzo di questo tipo d'applicazioni, e si dovrà evolvere ancora molto prima di potersi dire completo. Questi primi esempi ci indicano la via che seguirà questa tecnologia, e come vanno presi più come dimostrazioni che come prodotti pronti all'uso. In futuro, certamente, questa funzione sarà molto evoluta, e ci permetterà di avere fotografie sempre più in ordine e in meno tempo.

ARTICOLI CORRELATI