Claude Fable 5 nel mirino: polemica sulle restrizioni “invisibili” di Anthropic. Gli esperti: “Rallenta la ricerca sull’AI”

Raffaele Marino

Giugno 11, 2026

Il debutto pubblico di Claude Fable 5, il primo modello di livello Mythos sviluppato da Anthropic, avrebbe dovuto rappresentare una svolta per il laboratorio di intelligenza artificiale sostenuto da Amazon. Invece, a poche ore dal lancio, il nuovo sistema si è trovato al centro di una dura controversia che coinvolge ricercatori, sviluppatori ed esperti di governance dell’AI.

La polemica nasce da una scoperta contenuta nella documentazione tecnica pubblicata dall’azienda: in alcuni casi, il modello riduce deliberatamente la qualità delle proprie risposte senza informare l’utente. Una scelta che ha acceso il dibattito sul delicato equilibrio tra sicurezza, trasparenza e concorrenza nel settore dell’intelligenza artificiale.

Cos’è Claude Fable 5 e perché è considerato un modello rivoluzionario

Anthropic ha presentato Claude Fable 5 come il primo modello della nuova classe Mythos, una categoria di sistemi significativamente più avanzati rispetto alla precedente generazione.

Secondo l’azienda, il modello offre prestazioni superiori nella programmazione, nell’analisi complessa, nella gestione di progetti di lunga durata e nella cosiddetta memoria a lungo termine, ossia la capacità di mantenere il contesto e gli obiettivi di compiti articolati per periodi prolungati.

Il rilascio è arrivato pochi giorni dopo il deposito riservato della documentazione per una futura quotazione in Borsa, un passaggio che molti osservatori interpretano come un momento chiave nella crescita di Anthropic.

La scoperta che ha scatenato le critiche

La controversia è esplosa quando ricercatori indipendenti hanno analizzato le oltre 300 pagine del rapporto tecnico dedicato alla sicurezza del modello.

Nel documento emerge che Claude Fable 5 applica restrizioni specifiche quando identifica richieste legate allo sviluppo di tecnologie AI avanzate, come la progettazione di infrastrutture per l’addestramento dei grandi modelli linguistici o attività di ricerca considerate particolarmente sensibili.

A differenza dei tradizionali sistemi di blocco, il modello non rifiuta la richiesta e non avvisa l’utente. Continua invece a rispondere, ma in modo intenzionalmente limitato.

In pratica, l’utente riceve una risposta apparentemente normale, senza sapere che alcune informazioni sono state deliberatamente omesse o depotenziate.

Restrizioni invisibili e accuse di scarsa trasparenza

Il punto più contestato riguarda proprio l’assenza di trasparenza.

Per le richieste considerate rischiose in ambiti come cybersicurezza o biologia sintetica, Anthropic utilizza già meccanismi visibili che reindirizzano l’utente verso modelli meno potenti e segnalano chiaramente la limitazione.

Nel caso della ricerca avanzata sull’intelligenza artificiale, invece, il documento specifica che l’intervento “non è visibile all’utente”.

Secondo i critici, questo approccio rischia di compromettere il rapporto di fiducia tra utenti e sistemi AI.

Molti ricercatori sostengono che un modello dovrebbe adottare una delle due strade possibili: fornire l’assistenza richiesta oppure dichiarare apertamente di non poterlo fare.

La reazione della comunità scientifica

Le critiche sono arrivate da figure molto diverse tra loro, comprese persone che in passato avevano sostenuto le politiche di sicurezza promosse da Anthropic.

Nathan Lambert, ricercatore specializzato in modelli open source, ha definito la scelta “sconvolgente”, sostenendo che impedire in modo occulto l’accesso alle capacità più avanzate dei modelli finisca per ostacolare la ricerca scientifica.

Anche Dean Ball, esperto di politiche tecnologiche ed ex consulente della Casa Bianca, ha parlato di una forma di “sabotaggio segreto”, sostenendo che misure di questo tipo alimentino il sospetto che la sicurezza dell’intelligenza artificiale venga utilizzata per consolidare il vantaggio competitivo dei grandi laboratori.

Sulla stessa linea Jeremy Howard, fondatore di Fast AI, secondo cui la strategia adottata da Anthropic rischia di aumentare ulteriormente la concentrazione del potere tecnologico nelle mani di pochi attori.

Le critiche degli ex dipendenti di Anthropic

Tra le voci più dure figurano anche alcuni ex membri del team di ricerca dell’azienda.

Behnam Neyshabur, che aveva lavorato a progetti interni legati agli agenti autonomi e agli “scienziati artificiali”, ha accusato Anthropic di limitare la possibilità di utilizzare l’intelligenza artificiale per applicazioni scientifiche ad alto impatto.

Secondo l’ex ricercatore, concentrare le capacità più avanzate dell’AI nelle mani di un numero ristretto di organizzazioni rischia di rallentare il progresso tecnologico e scientifico globale.

Non tutti sono contrari: Fable 5 convince per prestazioni

Accanto alle critiche non sono mancati apprezzamenti per le capacità tecniche del nuovo modello.

Ethan Mollick, docente della Wharton School e tra gli studiosi più influenti nel campo dell’innovazione e dell’AI, ha evidenziato come Claude Fable 5 abbia ottenuto risultati superiori rispetto alla maggior parte dei modelli pubblicamente disponibili.

Anche Andrej Karpathy, ex responsabile AI di Tesla e cofondatore di OpenAI, oggi entrato in Anthropic, ha definito Fable 5 un “salto generazionale” rispetto alle precedenti versioni.

Karpathy ha comunque riconosciuto che i sistemi di protezione introdotti dall’azienda risultano al momento particolarmente sensibili e potrebbero richiedere ulteriori perfezionamenti.

La difesa di Anthropic: sicurezza e accessibilità devono convivere

Anthropic continua a difendere la propria strategia.

L’azienda sostiene che le nuove misure siano necessarie per evitare che modelli particolarmente avanzati possano accelerare attività considerate ad alto rischio, come lo sviluppo di sistemi AI sempre più potenti senza adeguate garanzie di sicurezza.

Dianne Na Penn, responsabile della gestione prodotto e della ricerca del laboratorio, ha spiegato che l’obiettivo è rendere disponibili capacità di frontiera senza rinunciare alle protezioni necessarie.

“Stiamo aumentando il livello di intelligenza dei modelli e contemporaneamente avanzando in modo responsabile sulla frontiera tecnologica”, ha dichiarato.

La dirigente ha inoltre riconosciuto che alcuni utenti potrebbero imbattersi in limitazioni eccessive nelle prime fasi, assicurando che l’azienda continuerà a migliorare i sistemi di sicurezza dopo il lancio.

Il nodo che divide il settore dell’AI

La vicenda di Claude Fable 5 riporta al centro uno dei temi più controversi dell’attuale corsa all’intelligenza artificiale: chi deve controllare le tecnologie più avanzate e fino a che punto è legittimo limitarne l’accesso.

Per i sostenitori di Anthropic, le restrizioni rappresentano una forma di prudenza necessaria in un momento in cui i modelli stanno raggiungendo capacità senza precedenti.

Per i critici, invece, la scelta rischia di creare una distinzione sempre più marcata tra chi sviluppa l’AI e chi può utilizzarla per contribuire al progresso scientifico, concentrando potere e conoscenza nelle mani di pochi grandi laboratori tecnologici.