12/07/2023 di Redazione

Modelli di AI in cloud, Amazon Web Services punterà sul prezzo

A detta del vicepresidente della divisione, Dilip Kumar, Aws può battere la concorrenza sul fronte del prezzo, anche grazie a chip proprietari su cui si basa Titan.

icona_t.jpg

Nell’intelligenza artificiale in cloud, Amazon Web Services è convinta di poter battere la concorrenza sul prezzo. Grazie ai servizi di IaaS, PaaS e SaaS, negli ultimi anni un numero crescente di aziende e di sviluppatori ha potuto avvicinarsi al mondo dell’AI e del machine learning senza dover acquistare hardware costoso e all’avanguardia. Ma per i cloud provider offrire servizi infrastrutturali, di piattaforma e applicativi ha un costo notevole.

 

Il training degli algoritmi, per esempio, richiede un’elevata capacità computazionale e significative risorse di storage, e questo si traduce non solo in spese hardware (per l’aggiornamento dei server) ma anche in elevati consumi e costi energetici. Tutto questo è ancor più vero per i large language model, i modelli linguistici di grandi dimensioni (come GPT-4) su cui si poggiano le applicazioni di AI generativa, e che devono saper gestire centinaia di miliardi di parametri.

 

“Questi modelli sono dispendiosi”, ha dichiarato Dilip Kumar, vicepresidente di Aws, ospite della conferenza “Momentum” organizzata da Reuters ad Austin, in Texas. “Ci assumiamo gran parte di questo sollevamento pesante indifferenziato, così da poter abbassare i costi per i nostri clienti”.

 

Sembra quindi che Aws voglia far leva sul valore della convenienza anche per i servizi di AI, così come ha sempre fatto in generale per il cloud computing rispetto alla principale offerta concorrente, Microsoft Azure. A differenza della società di Redmond, tra l’altro, e al pari di Google, Amazon può contare sul possesso di chip proprietari progettati per allenare ed eseguire i large language model.

 

La similitudine con Mountain View prosegue anche sul piano del software. Mentre Microsoft offre su Azure i modelli GPT di OpenAI, Google Cloud e Aws propongono entrambe dei modelli fondativi (foundational model) proprietari, chiamati rispettivamente PaLM e Titan.

 

Presentato lo scorso aprile e disponibile attualmente solo come anteprima gratuita, Titan include due large language model pre-allenati, già pronti all’uso o eventualmente personalizzabili (con l’ingestione di ulteriori dati del cliente). Una novità primaverile è anche Amazon Bedrock, servizio rivolto agli sviluppatori che permette di costruire, personalizzare e far scalare applicazioni di AI generativa. Non è dato sapere quali saranno i tariffari di Titan e Bedrock una volta in disponibilità generale, ma dalle dichiarazioni del vicepresidente di Aws par di capire che saranno meno costosi rispetto alle proposte di Microsoft Azure e Google Cloud.

ARTICOLI CORRELATI