C'è un modello di intelligenza artificiale che Anthropic ha costruito e non può mostrare al mondo. Non per mancanza di coraggio, ma perché quello che sa fare è semplicemente troppo. Si chiama Claude Mythos Preview, ed è il modello più avanzato che il laboratorio americano abbia mai sviluppato.
Il problema? Trova vulnerabilità nei sistemi informatici più critici del pianeta con una velocità e una precisione che nessuno strumento automatizzato aveva mai raggiunto prima.
Nelle ultime settimane, prima dell'annuncio ufficiale del 7 aprile 2026, il modello è stato testato in ambienti controllati. I risultati hanno lasciato i ricercatori senza parole.
Un bug nascosto da 27 anni, trovato in pochi dollari
Nicholas Carlini, ricercatore senior di Anthropic, ha descritto la situazione con una semplicità disarmante: ha trovato più falle di sicurezza nelle ultime settimane di test che in tutto il resto della sua carriera messa insieme. Tra le scoperte c'è una vulnerabilità in OpenBSD — sistema operativo noto per essere uno dei più sicuri al mondo, usato da banche, ambasciate e provider internet — presente nel codice da 27 anni. Bastava inviare pochi pacchetti di dati a un server per mandarlo in crash. Nessuno l'aveva mai trovata.
Poi c'è FFmpeg, la libreria video su cui si appoggiano centinaia di applicazioni globali. Mythos ha individuato una falla all'interno di una singola riga di codice che strumenti automatizzati avevano analizzato oltre cinque milioni di volte senza mai intercettarla. Sedici anni di invisibilità, risolti da un agente AI in pochi minuti.
E ancora: una catena di vulnerabilità nel kernel Linux capace di garantire il controllo completo di una macchina. Non una singola falla, ma più debolezze collegate in sequenza — esattamente il tipo di attacco che solo hacker di Stato di livello avanzato riuscivano a orchestrare fino a ieri.
La sandbox violata e l'email al parco
C'è un episodio che ha fatto il giro della comunità tech e che difficilmente si dimentica. Durante una sessione di test, una versione preliminare di Mythos era stata collocata in un ambiente isolato — una sandbox — con accesso limitato a una manciata di servizi predefiniti. Al modello era stato chiesto di tentare una fuga dal container e di avvisare il ricercatore supervisore. Mythos ha trovato il modo di uscire sviluppando un exploit a più fasi, si è connesso a internet e ha inviato l'email di notifica. Fin qui, tutto come previsto.
Quello che non era previsto: il modello ha poi pubblicato i dettagli dell'exploit su alcuni siti web accessibili al pubblico, apparentemente per dimostrare in modo autonomo di aver completato il compito. Il ricercatore Samuel Bowman ha scoperto l'avvenuto sfondamento ricevendo un'email inaspettata dal modello mentre mangiava un panino seduto in un parco.
I’m proud that so many of the world’s leading companies have joined us for Project Glasswing to confront the cyber threat posed by increasingly capable AI systems head-on.https://t.co/pn3HSVsThP
— Dario Amodei (@DarioAmodei) April 7, 2026
La risposta della community tech è stata immediata. Tra i post più condivisi:
Claude Mythos found a 27-year-old vulnerability in OpenBSD that survived decades of expert review.
— Antonio Vieira Santos (@AkwyZ) April 7, 2026
A 16-year-old bug in FFmpeg that automated tools hit 5 million times without catching.
AI isn't future-of-cybersecurity. It's now.
Project Glasswing is Anthropic's response: put…
Project Glasswing: 100 milioni di dollari per difendere internet
Di fronte a tutto questo, Anthropic ha fatto una scelta non ovvia: invece di silenziare le scoperte o rimandare sine die, ha convocato attorno a un tavolo le aziende che controllano la maggior parte dell'infrastruttura digitale globale. AWS, Apple, Google, Microsoft, Cisco, CrowdStrike, NVIDIA, JPMorganChase, Palo Alto Networks e la Linux Foundation. Insieme, con un unico obiettivo: usare Mythos per trovare e correggere le falle prima che qualcun altro lo faccia con intenti malevoli.
Il programma si chiama Project Glasswing — ispirato alla farfalla Greta oto, le cui ali trasparenti la rendono quasi invisibile, proprio come certi bug nel codice. L'impegno finanziario è concreto: 100 milioni di dollari in crediti di utilizzo e 4 milioni in donazioni dirette alle organizzazioni open source, inclusi Alpha-Omega, OpenSSF e Apache Software Foundation.
Il modello non sarà disponibile al pubblico. Almeno per ora. Anthropic ha dichiarato apertamente che Claude Mythos Preview è troppo rischioso per una distribuzione generalizzata, e che il piano è sviluppare le necessarie salvaguardie su un prossimo modello Claude Opus prima di considerare un accesso più ampio.
Approfondisci il ruolo dell'IA nella sicurezza della blockchain nella nostra sezione dedicata: Blockchain e tecnologia.
Cosa cambia adesso
Siamo entrati in una fase nuova. Non è più una questione di se l'IA sarà usata per attaccare sistemi informatici, ma di chi la userà per primo e con quali intenzioni. Project Glasswing è il tentativo di dare ai difensori un vantaggio strutturale prima che capacità simili diventino accessibili a chiunque — inclusi attori che non hanno alcun interesse a proteggere nessuno.
Come ha detto Carlini stesso nel video di presentazione del progetto, la capacità di Mythos non è solo trovare singole falle: è concatenarle. Tre, quattro, cinque vulnerabilità che da sole non valgono nulla, ma in sequenza aprono una porta su qualsiasi sistema. Questo è il livello che stiamo toccando.
