“Claude Mythos”: la fuga di dati svela il modello più potente di Anthropic. E fa paura per la cybersicurezza

Un errore umano nel sistema di gestione dei contenuti ha esposto quasi 3.000 documenti riservati, tra cui la bozza di lancio di un nuovo modello AI — nome in codice “Capybara” — descritto come “di gran lunga il più potente mai sviluppato”. Anthropic conferma: è già in test con clienti selezionati.


Si chiama Claude Mythos, o forse Capybara — i documenti trapelati usano entrambi i nomi per quello che sembra essere lo stesso modello di base. Ed è, secondo Anthropic stessa, “di gran lunga il modello di intelligenza artificiale più potente che abbiamo mai sviluppato”. La notizia non sarebbe dovuta uscire così. Ma un errore nella configurazione del sistema di gestione dei contenuti ha reso pubblicamente accessibile una cache di quasi 3.000 documenti riservati, inclusa la bozza del post di lancio. A scoprirlo e renderlo noto è stata la rivista Fortune.


Come è avvenuta la fuga

Il materiale — dati strutturati per pagine web, titoli, date di pubblicazione, PDF e file audio — era finito in un archivio pubblico non protetto a causa di un’impostazione predefinita del CMS esterno utilizzato da Anthropic: le risorse create con quel sistema vengono impostate come pubbliche per default, a meno che l’utente non modifichi esplicitamente i permessi. Nessuno lo aveva fatto.

I documenti sono stati esaminati da Roy Paz, ricercatore senior in sicurezza AI presso LayerX Security, e da Alexandre Pauwels, ricercatore di cybersicurezza all’Università di Cambridge, su richiesta di Fortune. Anthropic, informata della fuga giovedì, ha rimosso l’accesso pubblico all’archivio e ha riconosciuto che si è trattato di un “errore umano”.


Cosa c’è scritto nella bozza

La bozza descrive una nuova architettura che introduce un quarto livello di modelli — chiamato Capybara — posizionato al di sopra degli attuali Opus, che fino ad oggi rappresentavano il massimo della gamma. Il documento è esplicito: “Capybara è un nuovo nome per un nuovo livello di modello: più grande e più intelligente dei nostri modelli Opus, finora i più potenti.”

Rispetto a Claude Opus 4.6 — l’attuale punta di diamante — il nuovo modello otterrebbe punteggi “significativamente più alti” nei test di programmazione, ragionamento accademico e cybersicurezza. Il costo di esecuzione sarebbe più elevato, e il modello non sarebbe ancora pronto per un rilascio generalizzato.

Anthropic ha confermato i contenuti essenziali della bozza: “Stiamo sviluppando un modello generalista con progressi significativi nel ragionamento, nella programmazione e nella cybersicurezza. Data la potenza delle sue capacità, stiamo valutando attentamente come rilasciarlo.”


Il nodo della cybersicurezza

È proprio su questo punto che la bozza trapelata si fa più inquietante. Anthropic descrive Mythos/Capybara come “attualmente molto più avanzato di qualsiasi altro modello AI nelle capacità cyber” e avverte che il sistema “prefigura un’ondata imminente di modelli in grado di sfruttare vulnerabilità a una velocità superiore agli sforzi dei difensori”. In altre parole: il modello potrebbe essere usato da hacker per lanciare attacchi su larga scala prima che i sistemi di difesa riescano a reagire.

Per questo il piano di rilascio iniziale si concentra proprio sui difensori informatici: dare alle organizzazioni un vantaggio nel rafforzare i propri sistemi prima che la tecnologia sia accessibile a tutti. Non è la prima volta che Anthropic si confronta con questo tipo di rischio: Opus 4.6, rilasciato di recente, ha già dimostrato la capacità di individuare vulnerabilità sconosciute nel codice di produzione. E gruppi di hacker legati al governo cinese hanno tentato — in almeno un caso documentato — di sfruttare Claude per infiltrarsi in circa 30 organizzazioni tra aziende tecnologiche, istituzioni finanziarie e agenzie governative.


Il ritiro segreto per i Ceo europei

Tra i documenti esposti c’era anche un PDF relativo a un ritiro su invito nel Regno Unito per alcuni dei principali leader aziendali europei, a cui parteciperà il CEO di Anthropic Dario Amodei. L’evento — descritto come un incontro “intimo” in una residenza del Settecento trasformata in hotel e spa nella campagna inglese — prevede sessioni con legislatori e policymaker e accesso a funzionalità di Claude non ancora rilasciate pubblicamente.

Anthropic ha confermato che si tratta di “parte di una serie di incontri organizzati nell’ultimo anno” per discutere il futuro dell’intelligenza artificiale con i vertici del business europeo.


La corsa al modello più potente

Il contesto in cui si inserisce Mythos è quello di una competizione sempre più serrata tra i grandi laboratori di AI. A febbraio, OpenAI ha rilasciato GPT-5.3-Codex, dichiarandolo il primo modello classificato come “ad alta capacità” per compiti legati alla sicurezza informatica e il primo addestrato direttamente per individuare vulnerabilità software. Anthropic risponde con un modello che, stando alla bozza, supera quella soglia — e per questo richiede una cautela che la stessa azienda non aveva mai applicato a nessun rilascio precedente.