Amazon accelera sull’intelligenza artificiale generativa con nuovi modelli fondativi per la creazione di contenuti video, immagini e testi. Neanche il tempo, per Google, di vantarsi di essere il primo e unico hyperscaler del cloud computing a offrire modelli di GenAI per la creazione di audio e video (Veo e Imagen 3, appena presentati), che la concorrente di Seattle ha azzerato le distanze con gli annunci fatti a Las Vegas, durante la conferenza “Aws re:Invent 2024”. Oltre al recente ingresso di Google, fanno già parte di questo segmento di mercato anche OpenAI, Meta e Adobe, per citare solo i grandi.
Nella cascata di nuovi annunci di prodotto e collaborazioni c’è, per Amazon, quello di una serie di modelli che si distinguono per il tipo di output ma hanno in comune alcune caratteristiche. Tutti i modelli Amazon Nova si integrano con le basi di conoscenza di Bedrock (un servizio gestito serverless per la creazione e il perfezionamento di modelli) e inoltre, a detta dell’azienda, eccellono nella Retrieval Augmented Generation (Rag), tecnica sempre più usata per rendere contestuali e rilevanti gli output di un’applicazione di GenAI. Oltre al fine-tuning, è anche possibile migliorare gli algoritmi con la distillazione, una tecnica di apprendimento automatico che consente di trasferire conoscenza da un modello di maggiori dimensioni, che agisce come “maestro”, verso uno più piccolo (quindi più “leggero”, efficiente ed economico), il quale risulterà altamente accurato.
Nova Canvas e
Nova Reel rappresentano, rispettivamente, lo stato dell’arte per quanto riguarda la generazione di immagini statiche e di video. Nell’esempio qui sotto è stato creato con Nova Reel un video pubblicitario per un ipotetico marchio di pasta.
https://www.youtube.com/watch?v=g87NaWcszq0
Nova Premier è invece, il modello multimodale più avanzato nel catalogo di Amazon, ed entro il primo trimestre del 2025 sarà possibile usarlo come “maestro” per distillare modelli customizzati. Nova Pro è un’alternativa, sempre multimodale, che offre secondo Amazon “la migliore combinazione di accuratezza, velocità e costi per un ampio ventaglio di attività”.
Puntano sull’efficienza, sulla velocità di elaborazione e sulla convenienza i due modelli più piccoli della nuova offerta. Nova Lite è multimodale e può comprendere input di testo, immagini e video, mentre Nova Micro ingerisce soltanto input testuali ed è ancora più essenziale ed economico.
I linguaggi supportati da Amazon Nova sono circa duecento. L’azienda sottolinea la velocità e il vantaggioso rapporto costi/prestazioni di questi modelli: Nova Micro, Nova Lite, Nova Pro sono “almeno per il 75% meno costosi dei modelli più performanti nelle rispettive categorie su Amazon Bedrock”.
“All’interno di Amazon abbiamo in corso oltre mille applicazioni di GenAI e abbiamo una vista panoramica su quello che gli sviluppatori di applicazioni affrontano”, ha commentato Rohit Prasad, senior vice president Artificial General Intelligence dell’azienda. “I nostri nuovi modelli sono pensati per aiutare in queste sfide gli svikuppatori, esterni ed esterni, e per fornire una convicente intelligence e generazione di contenuti e allo stesso tempo fare significativi progressi in termini di latenza, rapporto costo/efficacia, personalizzazione, ancoraggio alle informazioni e capacità di agente”.
A Las Vegas la società ha anche annunciato la disponibilità generale delle istanze AWS Trainium2, nuove funzionalità di Amazon S3 e nuove funzionalità di database (tra cui Amazon Aurora DSQL), e ancora aggiunte nel servizio gestito Bedrock, la nuova generazione del servizio SageMaker (che permette di testare progetti di data analytics, calcolo scientifico e machine learning) e miglioramenti in Amazon Q Developer e Amazon Q Business.