Qualcomm non è più solamente un colosso dei chip per smartphone, ma sempre più si sta facendo spazio nel (competitivo) mercato dei semiconduttori per l’intelligenza artificiale, destinati ai server e in generale al settore dei data center, ma anche agli ambienti edge. L’AI sempre più diventerà una tecnologia distribuita, che raggiunge i dati là dove questi vengono prodotti, dunque anche in sensori e oggetti Internet of Things.
Qui si colloca l’acquisione appena annunciata da Qualcomm: Modular, una società che si occupa di infrastrutture software per l'AI con una focalizzazione sull’efficienza energetica, sui costi e sulla flessibilità di implementazione. Si tratta, in parole semplici, di un software che permette un’elaborazione AI distribuita su componenti per il calcolo diversi, su Gpu o su Cpu, Npu o Asic (circuiti specifici per determinate applicazioni) realizzati su misura.
Il vantaggio, per gli sviluppatori e per l’aziende utenti, è di non dover riscrivere il codice ogni volta che cambia il componente su cui poggia l’attività di inferenza AI. L’intelligenza artificiale in produzione diventa, quindi, “portatile”. La tecnologia di Modular funziona su chip di Amd, Arm, Apple e Intel, garantendo in ogni caso un uso ottimale delle risorse di calcolo. Grazie a un più efficiente uso delle Gpu, alla maggiore rapidità della compilazione dei modelli e del runtime e alla flessibilità nella scelta dell’hardware, secondo Modular è possibile arrivare a dimezzare i costi dell’inferenza AI.
Con l’acquisizione, al momento annunciata ma effettiva nella seconda parte dell’anno (superate le condizioni di chiusura e l’iter di approvazione classico), Qualcomm “rafforza il proprio ruolo come azienda di soluzioni AI pensata prima di tutto per gli sviluppatori, in grado di offrire AI generativa e agentica dall'edge al cloud”, ha fatto sapere l’azienda. “Qualcomm potrà offrire una tecnologia capace di gestire l'elaborazione dei dati su qualunque tipo di chip, dai dispositivi all'edge fino ai data center, con maggiore efficienza energetica a parità di prestazioni, più libertà nella scelta dell'hardware e un ecosistema aperto agli sviluppatori sempre più ampio”.
"Questa acquisizione segna un momento decisivo non solo per Qualcomm, ma per l'intero settore dell'AI", ha commentato Cristiano Amon, presidente e Ceo dell’azienda. "Con la diffusione dell'AI agentica il settore si sta orientando verso architetture distribuite e aperte a più fornitori, che hanno bisogno di basi software più moderne e meno chiuse. Siamo convinti che il futuro appartenga alle piattaforme trasversali, pensate per gli sviluppatori, capaci di funzionare su qualsiasi tipo di infrastruttura e di lasciare ai clienti piena libertà su come e dove utilizzare l'AI. Con Modular acceleriamo questo passaggio: mettiamo insieme la nostra dimensione e le nostre tecnologie per data center a basso consumo con la filosofia dell'ecosistema aperto, per contribuire ad aprire il prossimo capitolo dell'AI”.
"Modular è nata da una convinzione: l'AI ha bisogno di basi software più aperte ed efficienti, capaci di adattarsi a hardware e contesti d'uso diversi", ha dichiarato Chris Lattner, cofondatore e Ceo di Modular. "Entrare in Qualcomm ci dà la dimensione e la portata necessarie per accelerare questa missione. Insieme possiamo rendere lo sviluppo dell'AI più accessibile e più performante, migliorare la possibilità di spostare le soluzioni da un hardware all'altro e far crescere un ecosistema aperto, capace di coinvolgere più attori e di accelerare l'innovazione”.
(Immagine: Qualcomm)
La nuova architettura degli Hbc
L’acquisizione ben si colloca nella fase di evoluzione del business che Qualcomm sta attraversando, oltre che nel più ampio contesto di mercato. Negli ultimissimi anni, nella filiera dei chip una buona parte della capacità produttiva è stata dirottata su Gpu e memorie a elevata larghezza di banda (Hbm, High Bandwidth Memory), così da rispondere alla domanda di hardware per l’intelligenza artificiale. Una dinamica che ha penalizzato la disponibilità di chip per smartphone e Pc, peraltro due categorie di prodotto oggi più mature e a crescita lenta.
Stando alle dichiarazioni del direttore finanziario di Qualcomm, Akash Palkhiwala, nell’anno fiscale 2027 le vendite di chip per il segmento data center frutteranno alla società 5 miliardi di dollari di ricavi. Si salirà, poi, a 15 miliardi di dollari nel 2029. Nel prossimo futuro, Qualcomm sarà un’azienda “realmente diversificata”, ha detto Palkhiwala.
Nel frattempo Qualcomm ha messo in tasca alcuni importanti contratti di fornitura con alcuni hyperscaler, tra cui Microsoft e Meta (insieme ad altri non esplicitati), che utilizzeranno i suoi nuovi chip per l’intelligenza artificiale. Si tratta di una nuova categoria di processori che Qualcomm chiama High Bandwidth Compute (Hbc) e che è nata per risolvere un problema emergente: sempre più è la memoria, e non il calcolo, a limitare il funzionamento dei sistemi di inferenza AI. È il cosiddetto memory wall, il “muro della memoria”.
Anziché trattare la memoria come un componente distinta, associata a un processore, un Hbc presenta una integrazione 3D verticale, un unico “pacchetto” in cui il circuito logico di calcolo (compute die) è posizionato sotto la memoria Dram. Per le operazioni a bassa intensità di calcolo, come la fase di decodifica dei token negli LLM, il circuito logico elabora i dati direttamente “vicino alla memoria” (si parla di near-memory), evitando di spostare dati verso il System-on-Chip principale. Lo spostamento avviene solo se necessario.
Questo tipo di funzionamento si traduce in una maggiore efficienza energetica dell’inferenza AI, rispetto all’uso di processori con Hbm standard, ma anche in maggiori prestazioni e velocità. La prima generazione di Hbc, integrata nell'acceleratore Qualcomm Dragonfly AI250, consente fino a 133 TB/s di banda di memoria effettiva per scheda. Creato per le attività di inferenza AI nei data center, l’acceleratore Qualcomm Dragonfly AI250 associato agli Hbc di prima generazione può incrementare fino a 18 volte l’ampiezza di banda di memoria, rispetto a quanto offerto dal precedente Dragonfly AI200.
La seconda generazione di Hbc, il cui lancio è previsto insieme alla piattaforma Dragonfly AI300, permetterà invece (sulla carta) un incremento di banda fino a 54 volte rispetto ai modelli precedenti sprovvisti di Hbc. L'architettura High Bandwidth Compute è solo parte della più ampia roadmap di sviluppo annunciata da Qualcomm.