Con Gemini, Google si lascia il passato alle spalle, anche se solo un passato recente, quello di Bard: il precedente chatbot di intelligenza artificiale generativa è stato rapidamente rimpiazzato dalla sua evoluzione, Gemini. L’azienda ha quindi comunicato che ora c’è “un nuovo nome per Bard”, pur avendo solo una settimana fa introdotto il modello Gemini Pro all’interno di Bard, il cui nome dunque fino a pochi giorni fa ancora faceva ancora parte della strategia di marketing di Alphabet. L'amministratore delegato Sundar Pichai ha spiegato che “per rispecchiare la tecnologia avanzata di cui è dotato”, ovvero Gemini Pro, “Bard verrà ora rinominato Gemini”.
Confrontando il funzionamento di Bard al suo esordio in Italia con quello dell'attuale applicazione Web di Gemini, appena presentata, i progressi sono evidenti in termini di completezza, accuratezza e qualità delle risposte. L’affidabilità dei chatbot non è ancora totale, ma sicuramente Google sta accorciando le distanze dal tipo di esperienza offerto da OpenAI tramite ChatGpt. Gemini basato sul modello Pro 1.0 di Google è già disponibile gratuitamente tramite browser anche in Italia e con supporto alla lingua italiana (e ad altre 39). Si dovrà aspettare, invece, per la disponibilità delle applicazioni per Android e iOS in Italia.
Sul Web, per ora, l’interfaccia conversazionale può essere usata per ottenere risposte di vario tipo, informazioni puntuali, consigli ed elenchi, ma anche per caricare delle immagini e chiedere all’assistente virtuale una loro descrizione. Il risultato è notevole, come si evince dal test casuale che abbiamo eseguito: il modello ha non solo descritto l’immagine ma è risalito alla sua fonte e ha aggiunto informazioni di contesto. L’applicazione Web di Gemini riceve anche input vocali. Al momento non può, invece, generare immagini a partire da prompt testuali.
Le capacità di Gemini Advanced
La società di Mountain View ha anche annunciato Gemini Advanced, un chatbot basato sul modello fondativo più evoluto, ovvero Ultra 1.0. Rispetto alla versione gratuita, Gemini Advanced sa fare più cose e in generale sa “ragionare” meglio: sa scrivere codice, esegue istruzioni complesse, può creare contenuti digitali tenendo conto di diverse variabili (tra cui le tendenze social del momento), sostiene conversazioni più lunghe e dettagliate e comprende meglio il contesto delle richieste precedenti.
Al momento non supporta l’italiano, ma è già possibile utilizzarlo in lingua inglese abbonandosi per 21,99 euro al mese (ma con due mesi di prova gratuiti) al piano Google One AI Premium, avendo a disposizione 2 TB di capacità. Inoltre a breve gli abbonati a Google One AI Premium potranno utilizzare Gemini in Gmail, Documenti, Fogli, Presentazioni e Meet. Sembra, quindi, che Google stia seguendo con Gemini l’esempio del Copilot di Microsoft, ovvero stia integrando le funzionalità di AI generativa in diversi software e servizi, oltre a proporre applicazioni standalone.
“Continuiamo ad adottare un approccio audace e responsabile nel portare questa tecnologia nel mondo”, ha scritto in un blog post Sissie Hsiao, vice president and general manager Google Assistant and Bard. “Per ridurre problemi come contenuti non sicuri o pregiudizi, abbiamo integrato la sicurezza nei nostri prodotti in conformità con i nostri Principi per l’IA. Prima di lanciare Gemini Advanced, abbiamo condotto controlli approfonditi sulla fiducia e sulla sicurezza, compreso un red-teaming esterno. Abbiamo ulteriormente perfezionato il modello sottostante utilizzando la messa a punto e l'apprendimento per rinforzo, sulla base del feedback umano”.