claude-mythos-5): Il modello ad accesso limitato. Utilizza lo stesso modello e gli stessi 'pesi' di Fable 5, ma con i classificatori di sicurezza rimossi in aree specifiche. Non è generalmente disponibile ed è inizialmente limitato ai partner approvati del Project Glasswing Entrambi i modelli sono costruiti su una finestra di contesto di 1 milione di token e possono generare fino a 128.000 token di output per richiesta .
L'accesso a Fable 5 per gli abbonati ha una scadenza precisa:
Dopo il 23 giugno, Fable 5 resterà accessibile via API, piattaforme cloud come AWS e Vertex AI, e piani Enterprise a consumo . Mythos 5 non sarà mai disponibile tramite abbonamenti standard; rimarrà vincolato al programma di accesso fidato di Anthropic
.
Invece di bloccare semplicemente una richiesta pericolosa, Fable 5 utilizza una serie di sistemi di IA esterni (classificatori) che monitorano usi impropri e tentativi di 'jailbreak'. Quando un utente attiva un classificatore, la richiesta non viene rifiutata. Invece, il modello passa silenziosamente a un sistema meno capace, Claude Opus 4.8, e l'utente viene informato .
Questo meccanismo di sicurezza è attivo in tre aree principali:
L'azienda riconosce che il sistema è tarato in modo conservativo e può segnalare richieste innocue, ma afferma che le protezioni si attivano in media in meno del 5% delle sessioni . Il sistema è stato sottoposto a test approfonditi, incluso un 'bug bounty' esterno che non ha trovato jailbreak universali in oltre 1.000 ore di test
. Gli utenti non pagano per i prompt che attivano il reindirizzamento a Opus 4.8 prima che venga generato qualsiasi output, e i costi di prompt-cache per il cambio di modello vengono rimborsati
.
Un cambiamento fondamentale accompagna il lancio. Sia Claude Fable 5 che Claude Mythos 5 sono designati come "Modelli Coperti" da una nuova politica di conservazione dei dati. Ciò significa che hanno un periodo obbligatorio di conservazione dati di 30 giorni e non sono disponibili con accordi a conservazione dati zero, una modalità su cui alcuni clienti aziendali potrebbero fare affidamento .
Claude Mythos 5 rappresenta la frontiera delle capacità senza le reti di sicurezza applicate a Fable 5. La sua distribuzione è gestita attraverso un programma di accesso fidato:
Anthropic riporta che i suoi benchmark interni e i test con i partner mostrano Fable 5 come "lo stato dell'arte su quasi tutti i benchmark testati di capacità IA" . Le prestazioni chiave includono:
Comments
0 comments