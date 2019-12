L’intelligenza artificiale vuole partecipare all’Oktoberfest Ricercatori della Cornell University hanno utilizzato fotografie delle pietanze e bevande acquistate all’Oktoberfest di Monaco per allenare algoritmi di riconoscimento automatico delle immagini. Pubblicato il 27 dicembre 2019 da Valentina Bernocco

Usare il machine learning, e più precisamente il deep learning, per analizzare i comportamenti delle persone all’Oktoberfest: potrebbe sembrare un’attività ricreativa, da fare a tempo perso, ma in effetti lo studio dei gusti e delle scelte dei consumatori (di qualsiasi genere essi siano, nel mondo concreto e online) rappresenta per l’intelligenza artificiale uno dei campo d’applicazione più interessanti e più monetizzabili. In ogni caso, non era ancora successo che una tecnologia di apprendimento automatico messa all’opera per capire se alle persone piacciano di più gli hamburger o i curry-wurst, la birra o la Coca-Cola. Ci ha pensato la Cornell University di Ithaca (nello Stato di New York) a farlo, con un progetto di ricerca in cui sono state analizzate 1.100 immagini catturate nel corso di undici giorni all’Oktoberfest di Monaco.

Le immagini sono state ricavate dal flusso video di una videocamera che, dall’alto e da quattro diverse angolazioni, inquadrava i vassoi, i piatti e i bicchieri sorretti dagli avventori subito dopo il pagamento alla cassa di un tendone gastronomico, il quale proponeva 15 categorie di cibo e bevande. Su questo materiale, in tutto circa 600 GB di dati, i ricercatori dell’università statunitense hanno creato 2.500 annotazioni manuali.

Come spiegato nella loro pubblicazione, gli accademici hanno allenato dei modelli matematici affinché potessero riconoscere in automatico gli oggetti (cibi e bevande, distinguendo anche tra marchi di birra e tipologie di salsiccia) e conteggiare quante volte comparivano all’interno dell immagini. Per il training è stata impiegata una Api per il riconoscimento degli oggetti presente nella libreria open source di Google, Tensor Flow ( TensorFlow Object Detection API), mentre una selezione di 85 immagini è stata usata per valutare le prestazioni dei modelli matematici messi a punto.

Per allenare gli algoritmi non è stato però analizzato l’intero contenuto delle registrazioni video, 600 GB, fatto che avrebbe rappresentato un lavoro troppo impegnativo. I ricercatori hanno suggerito invece il ricorso a un metodo di “pseudo etichettatura” (pseudo labelling) nel quale un modello allenato su immagini catalogate permette di creare annotazioni sulle immagini ancora prive di tag. Quest’ultime, una volta arricchite dai metadati, possono essere usate per il training di un nuovo modello.



Si è giunti alla conclusione che “nel complesso” il deep learning è una tecnica utile per “individuare oggetti in determinate condizioni ambientali”. Quindi un studio come quello applicato all’Oktoberfest potrebbe servire, in futuro, a creare sistemi di checkout automatizzato, in grado di eliminare le attese alle casse di vari tipi di attività, di ristorazione o altro. Quanto realizzato dalla Cornell University è però solo un punto di partenza. Come sottolineato dai ricercatori, “è essenziale che i risultati di identificazione si un servizio di checkout automatizzato siano stabili e abbiano un livello di performance paragonabile a quello umano”.