13/05/2024 di redazione

OpenAI prepara una “magia”, mentre debutta una AI vision-to-language

Sam Altman ha smentito le indiscrezioni sul lancio di un motore di ricerca basato su AI generativa. Intanto l’Istituto di Innovazione Tecnologica di Abu Dhabi ha presentato un nuovo modello multimodale.

OpenAI si prepara ad annunciate “qualcosa di magico”. Non sarà un motore di ricerca, come avevano suggerito alcune indiscrezioni di Bloomberg e The Information, con l'attesa di un annuncio ufficiale nella giornata di oggi. Ai rumors è seguita rapidamente la smentita direttamente da Sam Altman, cofondatore e amministratore delegato dell’azienda sviluppatrice di ChatGpt. 

Secondo le fonti confidenziali, OpenAI sarebbe al lavoro su una tecnologia potenzialmente capace di competere con Google Search. Secondo The Information, tale novità potrebbe basarsi in parte sulla tecnologia di Bing, il motore di ricerca di Microsoft. Altri aspettavano da OpenAI l’annuncio di Gpt-5, una nuova versione del modello fondativo multimodale, a cui recentemente Altman aveva fatto accenno in una intervista parlandone però solo come un ipotetico termine di confronto delle tecnologie attuali.

In giornata l’imprenditore e informatico ha troncato le indiscrezioni pubblicando su X (la ex Twitter) un post che così recita: “Non Gpt-5, non un motore di ricerca, ma stiamo lavorando solo su un qualcosa di nuovo che, crediamo, le persone ameranno! Per me è qualcosa di magico”. Recentemente si è anche speculato sulle prossime funzionalità di GenAI integrate in iOS 18, e per alcuni osservatori l’annuncio di OpenAI potrebbe incrociare il mondo Apple.

Ai-emirati-arabi-falcon-2.jpg

In attesa di sapere di che si tratti, dall’altra parte del mondo rispetto a San Francisco, negli Emirati Arabi, è stato presentato un nuovo modello di AI generativa che punta a competere con quelli statunitensi di OpenAI (in tandem con Microsoft), Google, Meta e Amazon e con quelli cinesi di Baidu e Alibaba. L’Istituto di Innovazione Tecnologica di Abu Dhabi ha annunciato Falcon 2, un large language model di seconda generazione che può vantare capacità vision-to-language, ovvero sa “leggere” le immagini e generare in automatico delle descrizioni testuali.

Una funzionalità che risulta molto utile non solo per applicazioni di tecnologia accessibile, ma anche per scopi di automazione, dunque velocità, efficienza e risparmio, nell’ambito del marketing visuale, dei servizi al cittadino, dell’intrattenimento, dell’e-commerce e altro ancora. Basato sulla tecnologia open-source di Apache, Falcon 2 è declinato in diverse “taglie” a seconda dei contesti di destinazione: 180 miliardi, 40 miliardi, 7,5 miliardi e 1,3 miliardi di parametri.

scopri altri contenuti su

ARTICOLI CORRELATI