24/02/2022 di Redazione

Il metaverso sperimenta i comandi vocali per creare mondi

Meta ha svelato la demo di Builder Bot, una tecnologia di intelligenza artificiale generativa che può creare mondi virtuali assecondando le richieste dell’utente.

immagine.jpg

Grazie a Builder Bot, il metaverso di Meta si comporrà sotto ai nostri occhi, aggiungendo scenari e oggetti in base a comandi vocali che vengono interpretati in tempo reale da un software di intelligenza artificiale e tradotti in immagini. L’azienda proprietaria di Facebook, Instagram e Whatsapp ha svelato un progetto in fase di sviluppo, chiamato appunto Builder Bot: un programma di intelligenza artificiale generativa, che sa comprendere il linguaggio naturale e può creare all’istante elementi visuali coerenti con le richieste. In sintesi, può generare mondi immaginari a partire dal parlato. 

 “Nel metaverso”, ha dichiarato Mark Zuckerberg, “avremo bisogno di un’intelligenza artificiale incentrata sull’aiutare le persone a esplorare mondi virtuali, così come il nostro mondo fisico con la realtà aumentata”. Nella demo pubblicata su YouTube, Builder Bot viene definito come un “concetto esplorativo”, ma se è stato deciso di svelarlo al grande pubblico è probabile che una tecnologia come questa, magari più evoluta, possa effettivamente trovare spazio nel metaverso di Facebook e di altre piattaforme social. Nel filmato si vedono l’avatar di Zuckerberg e quello di un dipendente di Meta utilizzare i comandi vocali per creare una scena di loro gusto, una spiaggia con tanto di palme e tavolo da picnic, nonché musica e il suono delle onde e dei gabbiani in sottofondo.

La grafica è ancora piuttosto scarna e fa pensare più a un videogioco di non ultima generazione che non alla prossima rivoluzione digitale annunciata, come dovrebbe essere il metaverso nelle intenzioni di Zuckerberg. Si tratta però di una semplice demo e, come assicurato dal Ceo di Meta, “quando avremo fatto progressi con questa tecnologia, si potranno creare mondi ricchi di sfumature, da esplorare o nei quali condividere esperienze con altri, semplicemente tramite la voce”. L’amministratore delegato e i suoi dipendenti devono augurarsi che l’idea abbia successo, considerando le grandi promesse fatte e le altrettanto grandi aspettative che ora gravano sull’idea del metaverso. E considerando, inoltre, che da essa dipende in parte il futuro successo dell’azienda, perché sulla crescita organica di Facebook sembra non si possa più contare.
 

 

Gli assistenti virtuali evoluti di  Project CAIRaoke

L’idea di BuilderBot non sembra del tutto nuova: lo scorso anno OpenAI aveva svelato Dall-E, una tecnologia di rete neurale che può creare immagini a partire dal linguaggio naturale, in questo caso in forma scritta. L’utente digita una query, un po’ come se volesse eseguire una ricerca di immagini su Google, e ottiene come risultato una serie di varianti create al momento dal software. Builder Bot, in ogni caso, fa parte di un più ampio progetto di intelligenza artificiale conversazionale chiamato Project CAIRaoke, ancora in fase di sviluppo ma già portato all’interno degli smart display Portal.

Si tratta, nelle parole di Meta, di “un modello neurale che può alimentare conversazioni molto più personali e contestuali rispetto ai sistemi con cui oggi le persone hanno familiarità”. Assistenti vocali come Alexa, Google Assistant, Siri o Cortana (Meta non li cita esplicitamente, ma il riferimento è palese) oggi come oggi non riescono a gestire richieste del tipo “Silenzia tutte le mie notifiche per il resto della giornata, a meno che non chiami mia mamma” o “Pianifica una vacanza al mare per la famiglia, economica, per il fine settimana del 4 di luglio”.

 

(Credits: Meta)

 

Le opzioni oggi sono limitate perché gli assistenti virtuali non riescono a considerare il contesto in cui una richiesta viene formulata e seguono flussi di conversazione predefiniti. Se chiedessimo loro qual è la previsione meteo di domani ci saprebbero rispondere, ma rimarrebbero spiazzati di fronte a una domanda del tipo “Farà più o meno caldo rispetto alla scorsa settimana?”.

Gli assistenti virtuali creati con Project CAIRaoke, invece, sapranno sostenere una conversazione e fornire risposte in modo più evoluto: potranno ricordarsi di cose ascoltate o dette in precedenza, passare da un argomento all’altro e comprendere le sfumature e il contesto in cui le richieste sono state formulate. Inoltre, promette Meta, sarà possibile interagire con questi assistenti anche tramite comandi gestuali.

 

ARTICOLI CORRELATI