Claude Fable 5: il primo modello AI trattato come tecnologia dual-use (e cosa ci guadagna la tua azienda)
Fable 5 e Mythos 5 sono lo stesso modello: uno con i freni per tutti, uno senza freni distribuito col governo USA. L'analisi da ingegnere con tesi in cybersecurity: Project Glasswing, safeguard, fratelli Amodei e opportunità per le imprese.
Ho letto l'annuncio di Claude Fable 5 due volte. La prima da sviluppatore. La seconda con gli occhi di chi ha scritto una tesi in cybersecurity.
Ed è la seconda lettura quella che nessuno vi sta raccontando.
In questi giorni leggerete decine di post sui benchmark: "il modello più potente del mondo", "95% su SWE-Bench", "ha finito Pokémon guardando lo schermo". Tutto vero. Ma il benchmark non è la notizia.
La notizia è che per la prima volta nella storia un'azienda ha rilasciato lo stesso identico modello in due versioni: una con i freni per tutti noi, e una senza freni — distribuita in collaborazione con il governo degli Stati Uniti.
Claude Fable 5 e Mythos 5: lo stesso modello, due prodotti
Anthropic il 9 giugno ha presentato due prodotti che sono lo stesso modello:
- Claude Fable 5 — pubblico, disponibile per tutti via API e abbonamenti. Con safeguard integrati: dei classificatori analizzano le richieste e, se rilevano temi sensibili (cyber-offensivo, biologia/chimica, distillazione di modelli), la risposta viene generata da un modello meno potente (Opus 4.8). Succede in meno del 5% delle sessioni, dichiarano.
- Claude Mythos 5 — identico, ma con i safeguard cyber rimossi. Non potete comprarlo. È riservato a una platea verificata: cyberdefender, operatori di infrastrutture critiche e ricercatori biomedici selezionati, attraverso Project Glasswing, un programma gestito in collaborazione con il governo USA.
Da ingegnere, questo è il punto che mi ha fatto fermare. Non è marketing: è ingegneria del rischio applicata a un prodotto software. È il modo in cui si trattano le tecnologie dual-use — quelle che possono costruire e distruggere. Crittografia, nucleare, biotecnologie. Ora i modelli linguistici.
La cosa importante che quasi nessuno cita: Project Glasswing
Nel comunicato di rilascio c'è una frase passata in secondo piano: Mythos 5 viene distribuito "through Project Glasswing, in collaboration with the US government".
Cosa sappiamo di Glasswing:
- È partito con ~40 organizzazioni USA ed è stato esteso a ~150 organizzazioni in più di 15 Paesi (tra i partner citati: Apple, Nvidia, Microsoft, CrowdStrike, Palo Alto Networks).
- I partner del programma hanno già individuato oltre 10.000 vulnerabilità high/critical nei propri sistemi usando i modelli Mythos.
- Il caso più clamoroso: 271 vulnerabilità trovate in Firefox, alcune dormienti da 15 anni, poi corrette da Mozilla.
- Il red-teaming pre-rilascio ha coinvolto anche istituti governativi (UK AI Safety Institute).
Tradotto: i difensori — aziende e governi — ricevono la versione senza limiti per trovare le falle prima degli attaccanti. Tutti gli altri ricevono la versione con le protezioni.
È una scommessa precisa: dare un vantaggio temporale alla difesa. Chi si occupa di sicurezza sa quanto vale una finestra di vantaggio: tutto.
La lettura da cybersecurity
Qui parlo da chi la sicurezza l'ha studiata sul serio, non da tifoso. L'architettura dei safeguard di Fable 5 è un caso di studio di defense in depth:
- Classificatori in linea su tre famiglie di rischio (cyber, bio/chem, distillazione). Non filtri sul prompt: analisi della sessione.
- Degradazione controllata invece del rifiuto secco. La richiesta sospetta non viene bloccata: viene servita da un modello meno capace. Così l'attaccante non riceve un segnale netto di "blocco" da aggirare.
- Bug bounty esterno: oltre 1.000 ore di tentativi, zero jailbreak universali. Un partner esterno ha definito i safeguard cyber "i più robusti mai testati su un modello".
- Retention di 30 giorni del traffico per analisi delle minacce.
Onestà tecnica, però:
- I falsi positivi sono reali. Nei forum degli sviluppatori c'è chi si è visto bloccare la segmentazione di immagini MRI ("scambiata per bioterrorismo") o domande sulla malaria. Anthropic dichiara meno del 5% di sessioni impattate; i primi report sul lavoro scientifico parlano dell'8-9%. Qualcuno l'ha definita "una Ferrari con il limitatore a 50 km/h".
- La retention di 30 giorni prevale anche sui contratti zero-data-retention. Per i settori regolamentati europei (sanità, finanza, legale) è un tema GDPR da valutare prima di andare in produzione: parlatene con il vostro DPO.
- E sì, qualche ricercatore ha già documentato modi creativi per confondere i classificatori. La sicurezza perfetta non esiste; esiste il costo crescente dell'attacco. Qui il costo è stato alzato parecchio.
I fratelli che hanno costruito tutto questo
Dietro Anthropic ci sono un fratello e una sorella: Dario e Daniela Amodei.
Dario, fisico (Stanford) con PhD in biofisica (Princeton), era VP of Research di OpenAI: i suoi team hanno guidato lo sviluppo di GPT-2 e GPT-3. Daniela era VP of Safety & Policy della stessa OpenAI. A dicembre 2020 se ne andarono insieme ad altri ricercatori senior per una divergenza precisa: volevano un'azienda con la sicurezza al centro, non come reparto.
Gennaio 2021: nasce Anthropic. Maggio 2026: la Series H da 65 miliardi di dollari la valuta ~965 miliardi, sorpassando proprio OpenAI come startup AI più preziosa al mondo, con ricavi run-rate oltre i 47 miliardi. Lui CEO, lei President.
Cinque anni fa la loro posizione sembrava idealismo. Fable 5 — il modello più potente sul mercato, rilasciato con i freni e con un canale governativo per la versione senza freni — dimostra che si può vincere la gara tecnica senza rinunciare alla tesi di partenza.
Hanno discusso costruendo. E per ora hanno ragione loro.
Cosa significa per le imprese italiane (i numeri che contano)
Spogliamo il lancio dall'hype e teniamo ciò che impatta un'azienda:
- Agenti che lavorano per giorni, non minuti. Fable 5 è progettato per compiti lunghi e asincroni: pianifica, delega a sotto-agenti, si auto-verifica. Stripe dichiara di aver completato in un giorno una migrazione su un codebase di 50 milioni di righe stimata in 2+ mesi di lavoro di un team.
- Vista a livello documentale. Ricostruisce applicazioni dagli screenshot, legge documenti tecnici, tabelle, schemi. Per chi lavora con perizie, computi metrici, relazioni tecniche e planimetrie — il nostro pane quotidiano nel mondo dell'ingegneria del dato — cambia l'economia dell'estrazione dati.
- Contesto da 1 milione di token: intere basi documentali in una sola sessione.
- Costi da progettare: $10/$50 per milione di token (il doppio di Opus 4.8). Gli agenti autonomi moltiplicano i token: senza governance dei costi un singolo task può spendere decine di dollari in minuti. Il design del workflow ora vale quanto il modello.
- Finestra di prova: incluso nei piani in abbonamento fino al 22 giugno. Due settimane per fare test seri prima di pagarlo a consumo.
Noi di Digital-Enterprise questa transizione la vediamo da entrambi i lati: nel mondo digital — agenti AI per automazione di processi, customer care, eCommerce — e nel mondo dell'ingegneria del dato, dove la vision di questi modelli incontra rilievi, georadar, termografie e documentazione tecnica.
E la domanda giusta da farsi è cambiata. Non è più "che modello uso?", ma: "quale processo della mia azienda affiderei a un agente che lavora da solo per ore?"
Se la vostra risposta è "nessuno, non mi fido" — avete appena capito perché i safeguard sono la vera notizia di questo lancio. E se invece un processo in mente ce l'avete, è esattamente da lì che si parte: con un'analisi di fattibilità onesta, prima ancora che con il modello.