19/03/2025 di Valentina Bernocco

Gpu, Agentic AI e quantum computing tra le scommesse di Nvidia

All’evento Gtc 2025 l’azienda di Jensen Huang ha presentato le Gpu Blackwell Ultra, una famiglia di modelli open-source, strumenti per sviluppatori e molto altro.

(Immagine: Nvidia)

(Immagine: Nvidia)

Nvidia sfodera le nuove Gpu Blackwell Ultra, nuovi switch, una famiglia di Large Language Model (Llama Nemotron) basata sulla tecnologia di Meta e utile per la creazione di agenti di AI. E molto altro ancora. Da San Jose, dove è in corso la conferenza “Nvidia Gtc 2025”, una raffica di annunci è arrivata dai padroni di casa ma anche da aziende partner, vendor di infrastruttura e software, come Dell Technologies, HP, Hpe, Lenovo, Pure Storage, Crowdstrike e ServiceNow. Impossibile citarli tutti: possiamo dire che il tema di fondo (non sorprendentemente) è l’intelligenza artificiale, ma si è parlato anche della questione energetica e di quantum computing.

“Siamo dentro a uno stadio”, ha detto Jensen Huang durante il suo keynote, alludendo alla platea gremita. “Lo scorso anno per la prima volta abbiamo fatto questo dal vivo ed è stato come un concerto rock. Gtc è stato definito come la Woodstock dell’AI. E quest’anno viene descritto come il Super Bowl of AI: l’unica differenza è che in questo Super Bowl vincono tutti”. Siamo tutti vincitori, a detta del Ceo di Nvidia, perché l’intelligenza artificiale sta compiendo enormi progressi e, nel farlo, sta creando opportunità per l’intero settore Ict.

Poco più di due anni fa, ha ricordato il Ceo, al suo esordio ChatGPT faticava a rispondere adeguatamente a domande appena più complesse. Oggi abbiamo a disposizione un’intelligenza artificiale che può ragionare, anzi realizzare catene di ragionamento, e che genera enormi quantità di token. La natura del computing sta cambiando: i sistemi non funzionano più recuperando file ma generando token.

“Ogni singolo livello del calcolo è stato trasformato”, ha proseguito Huang. “Negli ultimi anni, e in particolare negli ultimi due o tre anni, ci sono state scoperte fondamentali. E un progresso enorme nell’intelligenza artificiale: la chiamiamo Agentic AI, e significa disporre di un’intelligenza artificiale che può agire. Può percepire il contesto del momento e, fatto molto importante, può ragionare nel dare una risposta o risolvere un problema e può pianificare e intraprendere un’azione”.

Il sistema Nvidia GB300 NVL72

Il sistema Nvidia GB300 NVL72

GPU Blackwell Ultra, pensate per l’AI

Il piatto forte nel menu di San Jose sono le nuove Gpu Blackwell Ultra, progettate per accelerare le attività di addestramento e inferenza di modelli di intelligenza artificiale. Nvidia non pensa soltanto ai chatbot di AI generativa ma anche a sistemi di reasoning AI, agenti e applicazioni di intelligenza artificiale “fisica”, come robot e sistemi di guida autonoma. Ciascuna Gpu prevede 288 GB di memoria Hbm (a elevata larghezza di banda) e consente prestazioni fino a 15 petaflops, superiori del 50% rispetto a quelle delle Gpu Hopper.

A margine di questo annuncio c’è quello di Nivida GB300 NVL72, un sistema rack raffreddato ad acqua, che aggrega in rack 72 Gpu Blackwell Ultra e 36 Cpu Grace per ottenere una potenza di calcolo enorme al servizio dell'intelligenza artificiale.

Altra novità è la serie Rtx Pro Blackwell, ovvero Gpu per workstation e server, progettate per supportare workload di intelligenza artificiale, grafica ad alte prestazioni e 3D, rendering e calcolo scientifico. Dispongono di 96 GB di memoria GDDR7 ultraveloce, Tensor Core di quinta generazione ed RT Core di quarta generazione.

 

Nvidia ha poi annunciato una serie di strumenti, microservizi, librerie e kit di sviluppo software, utili per creare applicazioni di machine learning, data science, analytics avanzati. Altra novità sono gli switch Silicon Photonics Networking (basati su fotonica, cioè su connessioni ottiche interne allo switch), che introducono avanzamenti di efficienza energetica, integrità del segnale e resilienza della  rete. Diverse le configurazioni proposte, tra cui quelle a 128 porte da 800 800Gb/s e a 512 ports da 200Gb/s.

L’Agentic AI di Nvidia

Sul palco di San Jose non poteva mancare l’Agentic AI, declinazione dell’intelligenza artificiale su cui gran parte del settore del software oggi sta investendo e che già si candida per essere la tendenza tecnologica dell’anno. 

Una novità presentata è Open Llama Nemotron: si tratta di una famiglia di modelli che permettono di creare applicazioni di AI di vario tipo, non soltanto agentica, eseguibili su server o Pc. Come il nome suggerisce, si basano Llama, cioè sui modelli open-source di Meta, ma su di essi Nvidia ha realizzato un post-training che ha permesso di migliorare le capacità di ragionamento logico, di calcolo matematico e di programmazione, oltre ai processi decisionali.

Disponibile attraverso i microservizi Nvidia Nim, la nuova famiglia di modelli include diverse “taglie”: Nano (per applicazioni eseguibili su Pc e dispositivi edge), Super (per applicazioni server, in contesti di data center) e Ultra (per sistemi complessi, eseguibili su macchine con più Gpu). 

L’avatar di Jensen Huang è stato usato per illustrare il fatto che è anche possibile, con Open Llama Nemotron, creare degli agenti di intelligenza artificiale utilizzando il framework Nividia NeMo. E aziende come Accenture, Amdocs, Atlassian, Box, Cadence, CrowdStrike, Deloitte, Iqvia, Microsoft, Sap e ServiceNow stanno già lavorando su questi modelli o li hanno già integrati nei propri software per aggiungere funzionalità di Agentic AI.

Fra gli annunci c’è anche Dynamo, un software a codice aperto per l’inferenza, che rappresenta l’evoluzione di Triton Inference Server ed è pensato per l’utilizzo nei grandi data center dedicati all’AI. Il software permette di orchestrare e accelerare le attività di inferenza anche su migliaia di Gpu, coordinando le comunicazioni tra di esse e scomponendo i task. Dynamo sarà disponibile su Aws, Microsoft Azure e Google Cloud.

(Immagine: Nvidia)

(Immagine: Nvidia)

Un centro dedicato al quantum computing

Anche il computing quantistico è tra i pensieri, ma pensieri concreti, di Nvidia. Nonostante le recenti dichiarazioni del Ceo sul fatto che dovremo aspettare vent’anni per utilizzare computer quantistici nel “mondo reale”, questo è un campo in cui l’azienda sta investendo: sorgerà a Boston un centro dedicato a questo, chiamato Nvidia Accelerated Quantum Research Center (Nvaqc).

Il centro ospiterà hardware e simulazioni di algoritmi quantistici su larga scala, una stretta integrazione di processori quantistici e attività di addestramento e distribuzione di modelli di AI per il quantum”, ha spiegato Tim Costa, senior director of computer-aided engineering, quantum and Cuda-X di Nvidia. Tra i partner coinvolti nel progetto ci sono anche aziende del settore come Quantinuum, QuEra e Quantum Machines, oltre a ricercatori del Mit di Boston e dell’Università di Harvard.

scopri altri contenuti su

ARTICOLI CORRELATI