Tutti parlano di DeepSeek: l’alternativa cinese e “low cost” ai modelli di intelligenza artificiale generativa di OpenAI, Google, Meta e altri colossi statunitensi. Non c’è stato quasi neanche il tempo, per Donald Trump, di prendersi il merito per il progetto Stargate (definito in realtà mesi prima dell’insediamento del neopresidente) e per il gigantesco investimento in data center, 500 miliardi di dollari, in piccola parte sostenuto da OpenAI e da Softbank e il larga parte da un fondo governativo di Abu Dhabi. Negli ultimissimi giorni le prime pagine dei quotidiani, di settore e anche generalisti, hanno portato alla ribalta DeepSeek e la sua sfida aperta a ChatGpt-
Fondata nel 2021 dall’oggi quarantenne Liang Wenfeng, la startup sviluppa Large Language Model open-source, che si distinguono dalle soluzioni nordamericane per i costi ridotti (sia quelli di sviluppo e addestramento dei modelli, sia quelli di utilizzo).
La settimana scorsa l’azienda ha lanciato un’applicazione chatbot gratuita basata sul modello DeepSeek-V3, e ha fatto il botto: in pochi giorni è diventata l’applicazione più scaricata su App Store, superando ChatGpt e Gemini. La notizia ha causato un terremoto a Wall Street: in un giorno, le principali tech company statunitensi hanno perso mille miliardi di dollari di valore (clamoroso lo scivolone di Nvidia, le cui azioni sono calate del 17%, erodendo 593 miliardi di dollari dal market cap).
La classifica App Store di oggi
DeepSeek ha però anche altri assi nella manica, idirizzati non all'utenza di massa ma alle aziende. Il suo modello di punta, DeepSeek-R1, quasi eguaglia 01 di OpenAI su diversi benchmark pur essendo molto più economico da usare. Il risparmio è sostanzioso: mentre OpenAI o1 costa 15 dollari ogni milione di token di input e 60 dollari per altrettanti token di output, R1 costa rispettivamente 0,55 e 2,19 dollari. Su R1 è basato DeepSeek Reasoner, un modello che “ragiona” in modo complesso: di fronte a una domanda o richiesta, genera una “catena di pensieri” (Chain of Thought) che migliora l’accuratezza della risposta. In sostanza, può scomporre un problema in più parti per trovare la soluzione.
Ma come siamo arrivati a fatti di questa settimana e a quello che è stato ribattezzato come un “momento Sputnik” per le società di intelligenza artificiale occidentali, cioè una doccia fredda di fronte all'improvvisa consapevolezza della superiorità dell'avversario? È cominciato tutto qualche anno fa con l’intuizione e la lungimiranza di “un tipo molto nerd con un’acconciatura terribile”, come Wenfeng viene descritto da uno dei suoi soci come (ne parla il Corriere della Sera). Il giovane in tempi non sospetti ebbe l’intuizione di cominciare ad acquistare migliaia di Gpu di Nvidia, ovvero quegli stessi componenti di calcolo grafico diventati poi negli ultimi due anni una merce contesa tra i grandi sviluppatori di modelli di AI e dagli hyperscaler del cloud computing.
Secondo la testata cinese 36Kr, l’imprenditore sarebbe riuscito ad accaparrarsi circa 10mila Gpu di Nvidia (alte fonti dicono 50mila) prima che entrassero in vigore le restrizioni all’import/export tra Stati Uniti e Cina. Un chiaro vantaggio è dato, poi, dalla ridotta potenza di calcolo necessaria per addestrare i modelli di DeepSeek. A detta dell’azienda di Liang Wenfeng, per mettere a punto DeepSeek-V3 sono serviti “solo” 6 milioni di dollari, cifra di per sé enorme ma piccola in confronto agli investimenti fatti da OpenAI e Meta per i loro modelli.
Immaginiamo che per molti utenti e aziende, in Europa ma soprattutto negli Stati Uniti, ci siano timori o resistenze culturali all’uso di un’applicazione cinese. Non sono solo pregiudizi, perché se interrogata su temi censurati dal governo cinese l’applicazione non risponde o nega il fatto (citiamo poi anche tra parentesi, sebbene meriterebbe un discorso a parte, l’attacco informatico subìto da DeepSeek nella giornata di ieri). E tuttavia, così come è successo per innumerevoli categorie di prodotti e servizi, anche nell’intelligenza artificiale una “alternativa cinese low cost” potrebbe sconvolgere il mercato facendo leva su strategie commerciali aggressive e sul rapporto qualità/prezzo. Il caso TikTok, poi, è esemplare: la piattaforma ha catturato (termine non casuale) la propria audience di fruitori e content creator giocando su un’identità generazionale e non geografica. DeepSeek sarà la “killer application” dell'intelligenza artificiale generativa, così come TikTok lo è stata per i social network?