Claude Fable 5 e Mythos 5: tutto sul modello Anthropic

Ci eravamo lasciati, in occasione del lancio di Opus 4.8, con una riga sepolta in fondo al comunicato di Anthropic: esiste una classe di modelli più potente, si chiama Mythos ed era in uso da pochi partner selezionati nell’ambito di Project Glasswing. Anthropic aveva promesso di portarla a tutti “nelle prossime settimane”. Le settimane sono passate e oggi quella promessa diventa concreta con il lancio di Claude Fable 5.

Per la precisione, Fable 5 e Mythos 5 sono lo stesso identico modello. La differenza non sta nelle capacità, ma nelle protezioni. Mythos 5 è la versione con i freni allentati, riservata a un piccolo gruppo di partner sulla sicurezza informatica. Fable 5 è la stessa potenza, ma con un sistema di sicurezza che la rende distribuibile a tutti. È la prima volta che Anthropic mette nelle mani del pubblico un modello di questo livello.

Indice dei contenuti

Cosa significa “classe Mythos”

Per capire l’importanza del lancio bisogna inquadrare cosa sia un modello di classe Mythos. Fino a oggi il modello più potente accessibile al pubblico era Opus 4.8. Mythos è un gradino sopra e secondo Anthropic le capacità di Fable 5 superano quelle di qualsiasi modello mai reso disponibile al pubblico dall’azienda.

I numeri che Anthropic riporta sono di quelli che fanno alzare il sopracciglio. Fable 5 è allo stato dell’arte su quasi tutti i benchmark testati, con un vantaggio che cresce man mano che il compito diventa più lungo e complesso. Ma il dato che racconta meglio cosa sa fare è un altro: durante i test iniziali, Stripe ha riferito che il modello ha compresso mesi di lavoro ingegneristico in giorni. In una base di codice Ruby da 50 milioni di righe, Fable 5 ha eseguito in un giorno una migrazione che a un intero team sarebbe costata più di due mesi di lavoro manuale.

C’è poi un aneddoto che farà sorridere chi segue il settore, e che a me sembra il più rivelatore di tutti. I modelli Claude precedenti faticavano a giocare a Pokémon, e avevano bisogno di impalcature software complesse che fornissero loro mappe, strumenti di navigazione e informazioni sullo stato del gioco. Fable 5 ha completato Pokémon FireRed dall’inizio alla fine usando solo gli screenshot grezzi del gioco, senza nessun aiuto esterno. Non è un dettaglio da nerd: è la dimostrazione di un salto nelle capacità visive del modello, che ora riesce a interpretare un’immagine e ad agire di conseguenza con un’autonomia che prima non aveva.

Le altre capacità: visione, memoria, lavoro analitico

Oltre alla programmazione, Anthropic insiste su alcune aree dove Fable 5 stabilisce un nuovo riferimento.

Sulla visione il modello sa estrarre numeri precisi da grafici scientifici dettagliati e ricostruire il codice sorgente di un’app web partendo solo dagli screenshot. Sul lavoro di conoscenza, Fable 5 ha ottenuto il punteggio più alto di qualsiasi modello sul Finance Benchmark di Hebbia, pensato per testare il ragionamento di livello senior, con guadagni importanti nell’interpretazione di documenti, tabelle e grafici.

C’è infine la memoria a lungo contesto, che è forse l’aspetto più utile nella pratica. Fable 5 mantiene la concentrazione attraverso milioni di token in compiti lunghi e migliora i propri risultati usando appunti che si scrive da solo. Quando Anthropic gli ha fatto giocare a Slay the Spire, dargli accesso a una memoria persistente su file ha migliorato le sue prestazioni tre volte più di quanto avesse fatto per Opus 4.8. È il tipo di capacità che conta per chi vuole usare il modello su progetti lunghi e articolati, dove la coerenza nel tempo è tutto.

Claude Fable 5 e la ricerca scientifica: il lato che fa riflettere

La parte del comunicato che merita più attenzione, e anche più cautela, riguarda Mythos 5 applicato alla ricerca scientifica: qui i risultati che Anthropic dichiara sono notevoli.

Sul fronte della progettazione di farmaci, gli esperti interni di Anthropic hanno usato Mythos 5 per accelerare alcune fasi del processo di circa dieci volte. Il modello, con strumenti di progettazione delle proteine ma senza assistenza umana, ha eguagliato o battuto operatori umani esperti, scegliendo i siti di legame, selezionando gli strumenti e recuperando dagli errori lungo il percorso. Nove dei quattordici bersagli proteici dello studio hanno prodotto candidati validi per lo sviluppo di farmaci.

Sul fronte della biologia molecolare, Mythos 5 è il primo modello di Anthropic a produrre in modo costante ipotesi scientifiche nuove e convincenti. In confronti diretti alla cieca contro i modelli di classe Opus, gli scienziati di Anthropic hanno preferito le ipotesi di Mythos circa l’80% delle volte. Una di queste ipotesi, un meccanismo inedito per una proteina dell’Escherichia coli, è stata poi confermata da uno studio di un laboratorio che lavorava indipendentemente sullo stesso problema.

E sul fronte della genomica, in poco più di una settimana di lavoro in gran parte autonomo, Mythos 5 ha assemblato dati di singole cellule per milioni di cellule attraverso 138 specie animali, e ha progettato e addestrato un modello di machine learning su misura che ha battuto un modello recente pubblicato sulla rivista Science, pur essendo cento volte più piccolo.

Questi risultati sono entusiasmanti per chi spera che l’AI acceleri la scoperta scientifica. Ma sono anche, per ammissione esplicita di Anthropic, il motivo per cui questo modello ha bisogno di protezioni così robuste. Le stesse capacità che progettano una terapia genica possono, nelle mani sbagliate, progettare qualcosa di pericoloso. È la natura a doppio uso di questi strumenti, ed è il cuore del problema che Anthropic sta cercando di gestire.

Come funzionano le protezioni di Fable 5

Qui sta la parte ingegneristica più interessante del lancio, e il modo in cui Anthropic ha risolto il dilemma tra potenza e sicurezza.

Fable 5 arriva con una serie di classificatori, cioè sistemi di AI separati che individuano i potenziali abusi, inclusi i tentativi di aggirare le protezioni, e impediscono al modello principale di rispondere. Il meccanismo è elegante: quando un classificatore rileva una richiesta che tocca aree sensibili, la risposta non viene rifiutata, ma gestita automaticamente da Claude Opus 4.8 al posto di Fable 5. L’utente viene avvisato ogni volta che succede. È un’idea sensata: invece di sbattere la porta in faccia all’utente con un rifiuto secco, il sistema fa rispondere il modello immediatamente meno potente, che resta comunque molto capace.

Le aree coperte dai classificatori sono tre. La sicurezza informatica, perché i modelli di classe Mythos eccellono nello scoprire e sfruttare vulnerabilità del software e potrebbero rendere gli attacchi informatici molto più facili ed economici. La biologia e chimica, per il rischio che attori malintenzionati ottengano un vantaggio in ricerche biologiche pericolose. E la distillazione, cioè i tentativi di estrarre le capacità di Fable per addestrare modelli concorrenti, un problema che Anthropic dice di aver già individuato su larga scala da parte di paesi autoritari.

Anthropic è trasparente su un punto in particolare: le protezioni sono volutamente troppo prudenti. L’azienda ammette che a volte bloccheranno anche richieste innocue, ma che si attivano in media in meno del 5% delle sessioni. La scelta di tarare i freni in modo conservativo per poter rilasciare il modello in fretta, accettando qualche falso positivo, è dichiarata apertamente invece di essere nascosta. Più del 95% delle sessioni con Fable non incontra nessun blocco e per quelle sessioni Fable 5 è di fatto identico a Mythos 5.

Sul fronte della robustezza, Anthropic ha sottoposto i classificatori a test intensivi: un programma esterno di bug bounty non ha trovato nessun “jailbreak universale” in oltre mille ore di test, anche se l’istituto britannico per la sicurezza dell’AI (UK AISI) ha fatto progressi in questa direzione durante una finestra di test iniziale. È un’ammissione onesta che la sicurezza perfetta non esiste e che l’obiettivo è rendere ogni eventuale aggiramento abbastanza lento e costoso da poterlo individuare prima che venga usato su larga scala.

Prezzi, disponibilità e la corsa alla capacità

Il prezzo è identico per entrambi i modelli: 10 dollari per milione di token in input e 50 per milione in output, meno della metà di quanto costava Claude Mythos Preview. Per gli sviluppatori, il model string sull’API è claude-fable-5.

Sulla disponibilità c’è però una complicazione che vale la pena spiegare, perché tocca direttamente chi usa Claude in abbonamento. Anthropic si aspetta una domanda altissima e difficile da prevedere, e ha quindi scelto un rilascio scaglionato. Sull’API e sui piani Enterprise a consumo, Fable 5 è pienamente disponibile da subito. Sui piani in abbonamento il percorso è più cauto: da oggi fino al 22 giugno Fable 5 è incluso senza costi aggiuntivi su Pro, Max, Team ed Enterprise a postazione. Dal 23 giugno verrà rimosso da quei piani e usarlo richiederà crediti di utilizzo. Anthropic dichiara di voler ripristinare Fable 5 come parte standard degli abbonamenti appena la capacità lo permetterà.

C’è infine una novità sulla gestione dei dati che riguarda i clienti business. Per i modelli di classe Mythos, Anthropic imporrà una conservazione dei dati di 30 giorni su tutto il traffico, dichiarando che non userà questi dati per addestrare nuovi modelli né per scopi non legati alla sicurezza. Servono, dice, a difendersi da attacchi complessi e a ridurre i falsi positivi dei classificatori.

Cosa significa per il settore

Proviamo a tirare le somme su cosa rappresenta davvero questo lancio.

Da un lato c’è il fatto tecnico: per la prima volta il modello più potente di Anthropic non è riservato a pochi, è accessibile a chiunque, sia pure con freni e con un rilascio scaglionato per gestire la domanda. È un passo avanti concreto rispetto alla cautela di Project Glasswing, dove Mythos era confinato a una cerchia ristretta.

Dall’altro c’è il modello mentale che Anthropic sta costruendo e che sembra il vero lascito di questo annuncio. L’idea che un modello e le sue protezioni siano due cose separabili, che si possa rilasciare la stessa potenza con livelli di sicurezza diversi a seconda di chi la usa, è un approccio che probabilmente vedremo diventare standard nel settore. Fable per tutti, Mythos per i partner fidati, stesso cervello sotto il cofano. È una risposta pragmatica alla domanda che tormenta l’industria dell’AI: come si distribuisce una capacità potente senza che finisca nelle mani sbagliate.

La risposta di Anthropic, almeno per oggi, è che si separano la potenza e i suoi freni e si accetta di sbagliare per eccesso di prudenza. Resta da vedere quanto velocemente i falsi positivi caleranno e quanto a lungo durerà la fase di razionamento sugli abbonamenti. Ma la direzione, quella, è ormai segnata.

The Clipboard

The Clipboard è una pubblicazione tech italiana indipendente fondata da Enrico Andreoli e Niccolò Proietti Savina, due blogger che vivono il settore tech da oltre 15 anni. Copriamo intelligenza artificiale, hardware, economia della tecnologia, privacy digitale e cultura internet con un approccio editoriale che privilegia l’analisi e la spiegazione piuttosto che la notizia fine a sé stessa.