05/06/2026 di redazione

Claude Mythos, l’AI di frontiera di Anthropic è ambivalente per la sicurezza

Il modello è accessibile, ora anche in Italia, tramite Project Glasswing. TrendAI entra a far parte dell’iniziativa.

L’intelligenza artificiale di frontiera, di cui Claude Mythos è esempio, ha bisogno di regole e limiti per arginare i rischi di cybersicurezza connessi al suo utilizzo e ai potenziali abusi. La stessa Anthropic ha ammesso che è necessario definire modalità verificabili per rallentare o mettere in pausa lo sviluppo di modelli AI di frontiera qualora queste tecnologie diventino troppo abili rispetto alla capacità di gestire i rischi associati.

Nel futuro immaginato da Anthropic, a un certo punto l’AI potrà sviluppare la capacità di "ricreare sé stessa", in autonomia, con meccanismi di auto-miglioramento ricorsivo. Questa capacità rappresenterebbe un enorme progresso tecnologico, dalle benefiche ricadute sulla società, sulla scienza, sulla medicina. Ma il rischio è che gli esseri umani perdano il controllo su questi sistemi capaci di trasformare sé stessi e il proprio comportamento.

Non siamo ancora a questo punto, e Anthropic per ora non si azzarda a dire quanti anni ci vorranno. Ma l'AI con auto-miglioramento ricorsivo potrebbe essere lo stadio di evoluzione immediatamente conseguente all’Agentic AI. Intanto, Claude Mythos ha segnato un bel passo in avanti con le proprie avanzate capacità di analisi del codice, ingegneria del software e ragionamento logico. Nelle mani di malintenzionati, uno strumento come questo potrebbe teoricamente servire per la scoperta rapida di vulnerabilità sfruttabili e per sferrare attacchi più complessi o di maggiore portata. Anche per queste ragioni il modello non è pubblicamente disponibile, e tuttavia di recente  è già stato oggetto di accessi non autorizzati attraverso una terza parte.

Un campanello d’allarme è suonato in questi giorni anche a Menlo Park. L’assistente Meta AI, sviluppato dall’azienda di Mark Zuckerberg, ha permesso a un gruppo di hacker di violare account Instagram di aziende, tra cui Sephora, e di personaggi di alto profilo della sfera pubblica come l’account obamawhitehouse, che raccoglie immagini degli anni di presidenza di Barack Obama (seguito da 24 milioni di persone). Non immaginiamo grandi operazioni di ingegneria informatica: gli attaccanti hanno facilmente raggirato il chatbot chiedendogli di collegare il profilo target a un indirizzo email (controllato dagli hacker stessi) e poi inviando a Meta AI un codice di verifica. Una falla logica del sistema, più che tecnologica.

La contromisura: Project Glasswing

Anthropic ha preso in carico il problema dei rischi dell’AI con Project Glasswing, un’iniziativa di monitoraggio e gestione del rischio che ha coinvolto da subito, oltre all’azienda dei fratelli Amodei, anche Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, la Linux Foundation, Microsoft, Nvidia e Palo Alto Network. Alla lista si è aggiunta ora TrendAI, la divisione B2B di Trend Micro, che userà il modello in supporto ad attività di revisione e analisi del codice software.

Inoltre poco meno di duecento aziende (erano 40 in un primo momento, ma altre 150 sono state appena aggiunte) potranno a usare gratuitamente l’anteprima di Claude Mythos per condurre scansioni di sicurezza e trovare rapidamente vulnerabilità. Nell’ambito dell’iniziativa, Anthropic regalerà crediti di utilizzo per un valore complessivo di 100 milioni di dollari.

“L’anteprima di Mythos”, ha scritto Anthropic nell’annunciare il progetto, “ha già trovato migliaia di vulnerabilità molto gravi, alcune delle quali riguardano tutti i principali sistemi operativi e browser Web. Data la velocità del progresso dell’AI, non ci vorrà molto prima che queste capacità proliferino, non solo tra chi è impegnato a distribuirle in modo sicuro. La ricaduta sulle economie, sulla sicurezza pubblica e nazionale potrebbe essere grave. Project Glasswing è un urgente tentativo di mettere al lavoro queste capacità per scopi di difesa”.

Queste notizie toccano da vicino l’Italia perché Anthropic ha da poco esteso l’accesso alla preview di Claude Mythos a una quindicina di Paesi, tra cui il nostro. Secondo indiscrezioni delle agenzie di stampa Ansa e Adnkronos, la società avrebbe esteso l’invito a testare il modello anche a Enisa, l'agenzia europea per la cybersicurezza, che diventerebbe così la prima istituzione UE affiliata a Project Glasswing. È invece notizia ufficiale, di qualche giorno fa, l’apertura del primo ufficio di Anthropic in Italia, prevedibilmente a Milano, ma ancora l'indirizzo esatto non è stato comunicato.

scopri altri contenuti su

ARTICOLI CORRELATI