24/01/2025 di redazione

Ecco Operator, OpenAI lancia un agente di AI che naviga sul Web

L’ultima novità dell’azienda di Sam Altman è Computer-Using Agent che può navigare online e svolgere azioni per l’utente, per esempio prenotazioni e acquisti.

(Immagine: OpenAI)

(Immagine: OpenAI)

Con l’ultima novità di OpenAI, chiamata Operator, continua il percorso di convergenza tra l’intelligenza artificiale generativa e i motori di ricerca, di cui sono esempi anche SearchGtp e Perplexity.ai. Ma quello dell’azienda di Sam Altman (reduce dal grande annuncio del progetto Starxxx) è qualcosa più di un motore di ricerca: è un agente di AI che durante la navigazione Web può non solo trovare cose ma anche eseguire compiti al posto delle persone. Per esempio, può prenotare una cena al ristorante o un soggiorno in hotel, oppure fare la spesa o altri acquisti online, o ancora aiutare a pianificare una gita fuori porta.

Azioni che vengono innescate da un prompt testuale: basta formulare una richiesta il più possibile specifica. L'agente troverà nel Web i riferimenti e le informazioni corrispondenti, potendo poi passare all'azione. In uno degli esempi forniti da OpenAI si legge: “Trovami un ristorante con un ottimo happy hour per sei persone, il prossimo mercoledì”. Altro esempio: “Aiutami a organizzare un viaggio in tenda a Yosemite. Trovami un campeggio con ottime recensioni e una bella area picnic”.

Disponibile al momento come anteprima di ricerca, Operator si basa su modello di tipo Computer-Using Agent (CUA), a sua volta basato su una versione di GPT-4o e su apprendimento potenziato. Il modello è stato addestrato per poter interagire con gli elementi di interfaccia grafica che normalmente si trovano nelle pagine Web e nei browser: pulsanti, menù, campi di testo. Può, quindi, navigare online senza dover usare Api specifiche per il sistema operativo o per il Web. Volendo, è possibile salvare i prompt che potrebbero tornare utili in futuro per far compiere a Operator azioni simili.

(Immagine: OpenAI)

(Immagine: OpenAI)

Il modello Computer-Using Agent, ha spiegato l’azienda, “beneficia dei progressi in termini di ragionamento, multimodalità e sicurezza, ponendo le basi per agenti come Operator affinché possano completare compiti complessi e in più fasi per gli utenti. Questo è l’inizio di un futuro in cui l’intelligenza artificiale non si limita a fornire informazioni, ma è anche in grado di eseguire autonomamente i flussi di lavoro, aiutando sia le aziende sia i privati”.

OpenAI ha scelto di rendere disponibile, inizialmente, il nuovo strumento ( all’indirizzo opertor.chatgpt.com) solo agli utenti Pro residenti negli Stati Uniti, “per consentire un rollout sicuro e iterativo”. L’agente di intelligenza artificiale potrà imparare da queste prime esperienze e perfezionare le proprie funzionalità gradualmente. L’azienda punta a estendere poi la disponibilità di Operator agli utenti Plus, Team ed Enterprise e integrare poi la funzionalità in ChatGPT. L’azienda ribadisce di aver “implementato rigorose misure di sicurezza per garantire un uso sicuro e responsabile di Operator”. 

scopri altri contenuti su

ARTICOLI CORRELATI