Ricercatori di IA di tutto il mondo, sia nel settore privato che in ambito accademico, concordano ampiamente sul fatto che un requisito di «zero jailbreak» non sia raggiungibile con i metodi attuali . Le ragioni affondano nelle fondamenta matematiche del funzionamento dei grandi modelli linguistici.
Il paradosso del jailbreak. Un articolo del 2024 su arXiv (aggiornato a maggio 2026) ha dimostrato formalmente due paradossi: primo, è impossibile costruire un classificatore perfetto di jailbreak; secondo, un modello più debole non può rilevare in modo coerente se un modello più forte è stato jailbreakato . Non è un bug che si possa riparare: è una limitazione matematica inerente al modo in cui l'allineamento è definito.
Una corsa agli armamenti, non un problema risolvibile. Il jailbreaking è un problema intrinsecamente avversariale. Gli attaccanti scoprono continuamente nuovi schemi di prompt, trucchi di codifica e strategie multi-turno che eludono i filtri esistenti. Non appena una classe di jailbreak viene chiusa, emergono nuove varianti .
Scalabilità autonoma dei jailbreak. Uno studio del marzo 2026 pubblicato su Nature Communications ha scoperto che i grandi modelli di ragionamento possono ora agire come agenti di jailbreak autonomi, raggiungendo un tasso di successo complessivo del 97,14% su tutte le combinazioni di modelli testate . La superficie d'attacco sta crescendo, non diminuendo.
Consenso degli esperti. Gli esperti di sicurezza affermano che bloccare completamente i jailbreak «bloccherebbe ogni implementazione di IA avanzata» — lo standard non è un obiettivo da raggiungere con delle patch, ma un'impossibilità dimostrabile .
Questa richiesta non nasce dal nulla. Segue un chiaro arco di crescente pressione governativa su Anthropic:
Il precedente conflitto con il Pentagono. Anthropic era già in una disputa con il governo USA per le sue interazioni con il Pentagono, che aveva designato l'azienda come «rischio per la catena di approvvigionamento», ordinando alle agenzie federali di limitare o cessare l'uso dei suoi prodotti .
La molla di Amazon. L'amministratore delegato di Amazon, Andy Jassy, avrebbe allertato la Casa Bianca su specifici problemi di sicurezza con Fable 5, accelerando l'intervento dell'amministrazione . Almeno altre cinque aziende hanno sollevato allarmi
.
Lo spegnimento improvviso. Il 12 giugno alle 17:21 ET, Anthropic ha ricevuto la lettera del Dipartimento del Commercio. Verso le 22:00, entrambi i modelli sono stati spenti per tutti i clienti in tutto il mondo — la prima volta che gli Stati Uniti applicano controlli all'esportazione a un modello di IA commerciale già in uso pubblico .
L'ultimatum zero jailbreak. Dopo lo spegnimento, la Casa Bianca è passata da una restrizione all'esportazione all'imposizione di uno standard di sicurezza tecnicamente impossibile come condizione per i rilasci futuri .
TechCrunch ha definito l'intera vicenda come una mossa politica che «non è mai stata veramente su un jailbreak dell'IA» — un segnale che il governo è disposto a determinare unilateralmente quando un modello di IA è troppo pericoloso per operare .
La posizione della Casa Bianca, riportata da più fonti, è che il modello Fable 5 di Anthropic possa tornare solo se l'azienda renderà i jailbreak impossibili . Non è una richiesta di miglioramento incrementale o di un processo di gestione delle vulnerabilità a livelli — è un assoluto binario: o non esiste alcun jailbreak da nessuna parte, o il modello non può essere rilasciato
.
Anthropic ha ribattuto, affermando che «nessun tester è ancora riuscito a trovare un jailbreak universale» e che l'evitamento totale di qualsiasi jailbreak non è possibile per loro né per nessun'altra azienda . L'azienda ha anche sottolineato di «non aver ancora ricevuto la segnalazione di un potenziale jailbreak non universale preoccupante che abbia portato a un risultato dannoso»
.
Sulla base di quanto riportato da diverse testate, Anthropic si trova di fronte a tre possibili strade strategiche:
1. Conformità e negoziazione. L'amministratore delegato Dario Amodei ha incontrato i funzionari della Casa Bianca il 15 giugno per negoziare un quadro di valutazione delle vulnerabilità accettabile per entrambi — uno che sostituisca l'assoluto zero jailbreak con uno standard a livelli di gravità . La Casa Bianca e Anthropic starebbero collaborando a un quadro per valutare la serietà delle vulnerabilità di sicurezza
. Questa è la strada che Anthropic sembra perseguire al momento.
2. Sfida giudiziaria o politica. Anthropic potrebbe contestare i controlli all'esportazione in tribunale, sostenendo che il governo ha superato la propria autorità statutaria o violato il giusto processo applicando controlli all'esportazione in modo retroattivo a un prodotto commerciale già pubblico . Sarebbe una mossa ad alto rischio e ad alto impatto che potrebbe creare un precedente fondamentale.
3. Ristrutturazione o delocalizzazione delle operazioni. Anthropic potrebbe limitare i rilasci di modelli a giurisdizioni con quadri normativi più prevedibili, o riconfigurare la propria struttura societaria per separare i prodotti destinati agli USA da quelli globali. Alcuni analisti descrivono questa come l'«opzione nucleare» che altererebbe radicalmente il modello di business di Anthropic.
Questa disputa cristallizza tre tensioni fondamentali che definiranno il futuro dell'IA avanzata:
Realtà tecnica vs. assolutismo normativo. Il governo richiede una garanzia — zero jailbreak — che l'informatica dimostra essere impossibile . Se l'amministrazione insiste su questo standard, ha di fatto un potere di veto su qualsiasi rilascio di modelli avanzati, poiché nessun laboratorio può soddisfare il requisito.
Controlli all'esportazione su software pubblico. Per la prima volta, gli USA hanno applicato controlli all'esportazione a un modello di IA commerciale già accessibile al pubblico . Questo crea un precedente per cui qualsiasi laboratorio di IA può ricevere l'ordine di spegnere un prodotto da un giorno all'altro in base a una determinazione unilaterale di sicurezza nazionale.
Indipendenza vs. controllo di fatto. Anthropic è stata fondata con una forte enfasi missionaria sulla sicurezza e l'indipendenza. L'azione della Casa Bianca dimostra che anche i laboratori più «responsabili» possono essere costretti a conformarsi a standard governativi tecnicamente irrealistici — o vedere i propri prodotti semplicemente spenti . Come ha scritto Bloomberg, il blocco segna un «inversione di rotta USA» e un «avvertimento alla Silicon Valley» che l'era dell'implementazione dell'IA avanzata autoregolamentata potrebbe essere finita
.
Comments
0 comments