Nello shopping e nelle esperienze di smart home di Amazon stanno per arrivare nuove possibilità basate sull’intelligenza artificiale, sul dialogo con Alexa (il software dei dispositivi Echo) e sulle immagini. Due novità, cioè Alexa Conversations e StyleSnap, portano verso un’esperienza di interazione con l’e-commerce e con le applicazioni conversazionali che sarà sempre più ricca, multimediale, personalizzata. Controllata da Amazon, potrebbe dire qualcuno. Entrambe sono state annunciate a Las Vegas, dove è in corso la conferenza dedicata machine learning e dintorni “Re:Mars”, principalmente rivolta agli sviluppatori di applicazioni.
Alexa Conversations è “un nuovo approccio basato su deep learning, che gli sviluppatori possono usare per creare esperienze di voce naturale su Alexa con minor sforzo, un ridotto numero di linee di codice e una minore quantità di dati di training”. Come noto, il deep learning (o apprendimento profondo) è una declinazione dell’apprendimento automatico in cui si impiegano schemi di ragionamento gerarchici, simili a quelli umani, e che risulta efficace in applicazioni di riconoscimento immagini, comprensione del linguaggio naturale e altri ambiti complessi. Senza una base di dati sufficientemente ampia e completa, i modelli matematici di deep learning non possono essere “allenati” a dovere.
Tale problema viene risolto da Alexa Conversations impiegando un dialog manager basato su intelligenza artificiale e su un motore di “simulazione delle conversazioni” che genera in automatico dei dati di training. Allo sviluppatore è richiesto di fornire degli esempi di dialoghi (in cui siano contenute le frasi che Alexa dovrà comunicare agli utenti) e l’elenco delle azioni che presumibilmente l’utente potrà compiere. Alexa Conversations, quindi, utilizza tali informazioni per generare delle conversazioni e le relative variazioni, e in questo modo apprende i possibili sviluppi dello scambio di battute fra l’utente e il software.

Questa nuova tecnologia è già stata impiegata da Atom Tickets, un servizio di vendita di biglietti per il cinema, dimostrando di poter ridurre notevolmente il lavoro di preparazione del software: sono state necessarie 1.700 linee di codice (il 70% in meno rispetto ad altri metodi) e solo 13 esempi di dialogo con i clienti. Altre demo, mostrate nella prima giornata di Re:Code, riguardavano Uber, OpenTable (un’app di prenotazione ristoranti), il sito di recensioni di film Internet Movie Database e Amazon Pay. Gli sviluppatori interessati possono fare richiesta per testare una versione di anteprima di Alexa Conversations.
StyleSnap è, invece, una funzione basata su intelligenza artificiale destinata all’applicazione per smartphone di Amazon: l’utente che si innamori di particolare capo di abbigliamento o accessorio può fotografarlo per trovare, attraverso l’app, delle proposte di articoli simili in vendita. Per i clienti, questa novità significherà poter scoprire nuove tendenze e trovare articoli di loro interesse più facilmente. I partecipanti all’ Amazon Influencer Program potranno ottenere una commissione sugli articoli venduti attraverso le loro fotografie.
“La semplicità dell’esperienza del cliente nasconde la complessità della tecnologia che ci sta dietro”, ha sintetizzato Jeff Wilke, il Ceo della divisione Consumer Worldwide di Amazon. Per mettere a punto questo strumento, infatti, è stato necessario usare algoritmi di deep learning per analizzare una variegata massa di dati non strutturati.
“Le immagini lifestyle i post degli influencer sono imprevedbili, perché le pose e i luoghi sono innumerevoli: si va dall’influencer che mangia un croissant all’interno di una caffetteria, alla celebrità che si gode un mojito sotto all’ombrellone in una spiaggia assolata”, si legge in un blogpost, nel quale l’azienda ha descritto la procedura usata per ridurre, anche in questo caso, lo sforzo di allenamento del sistema di deep learning. In sintesi, il metodo sviluppato dai ricercatori di Amazon “permette al network di apprendere nuovi concetti e allo stesso tempo di ricordare le cose imparate in passato, fatto critico per consentire a StyleSnap di funzionare bene su grandi volumi di dati”.