Si comporta un po' come uno scimpanzé, anche se non ci assomiglia per niente. Un nuovo sistema robotico basato sul deep learning e messo a punto dai ricercatori di Nvidia ha la capacità di apprendere attraverso l'osservazione: in sostanza guarda, impara e imita, un po' come fanno le scimmie. Ma risponde anche a indicazioni verbali, potendo quindi eseguire dei comandi e non una semplice replica dei gesti osservati. Nel nuovo laboratorio di Seattle dedicato alla ricerca e sviluppo sull'intelligenza artificiale, inaugurato da Nvidia l'anno scorso, è stato realizzato un sistema che unisce apprendimento profondo (un modello software basato su schemi gerarchici simili quelli del ragionamento umano), reti neurali artificiali e, per quanto riguarda l'hardware, una unità grafica Gpu Nvidia Titan.

Di questo metodo si parlerà più approfonditamente a Brisbane, Australia, sul palco di una conferenza dedicata a robotica e automazione. Due elementi operano in sinergia: un sistema “percettivo”, che osserva la scena e riconosce oggetti e azioni, e un sistema “esecutivo”, che si attiva in tempo reale ripetendo i gesti. Nel video pubblicato da Nvidia si si vede un braccio meccanico eseguire una sequenza di azioni con degli oggetti, posizionando e spostando dei cubi colorati.

In parole semplici, un sistema di intelligenza artificiale composto da diverse reti neurali osserva una scena dimostrativa, individua gli elementi fisici, le forme, le distanze, la profondità di campo e le relazioni fra gli oggetti, potendo capire per esempio se il cubo rosso si trovi sopra quello giallo oppure sotto, o a che distanza siano posti il cubo blu e la macchinina. Le singole azioni osservate nella dimostrazione vengono tradotte in stringhe verbali, in frasi insomma.

Come spiegato in termini più tecnici nel whitepaper pubblicato da Nvidia, questo metodo potrà trovare numerose applicazioni in virtù di un vantaggio peculiare: invece di usare dei dati artificiali per istruire il programma, si possono realizzare dimostrazioni “reali”. I campi di applicazione dunque si allargano ed è possibile avvalersi di una singola dimostrazione per istruire un sistema a eseguire un certo tipo di azione.