Il grilletto immediato per i controlli all'esportazione è stato un presunto jailbreak — un metodo per aggirare le barriere di sicurezza dei modelli. Tuttavia, le due parti discordavano nettamente sulla sua gravità.
Il disaccordo è rapidamente degenerato. Secondo diversi resoconti, Amodei ha reagito con forza nelle chiamate con i funzionari dell'amministrazione, descrivendo le preoccupazioni del governo come un fraintendimento, e a un certo punto i negoziati sono quasi falliti completamente .
La Casa Bianca ha designato Fable 5 come caso di prova per le sue nuove linee guida dell'ordine esecutivo sull'IA, coordinando i lavori tra Commercio, Tesoro e la stessa Casa Bianca . L'amministrazione temeva che le capacità dei modelli potessero consentire alla Cina l'accesso a strumenti offensivi di cybersecurity e ad altre tecnologie pericolose a duplice uso
.
Entro pochi giorni dalla crisi dei controlli all'esportazione, la Casa Bianca e Anthropic sono passate dallo scontro a una negoziazione strutturata . Il 17 aprile 2026, Amodei ha incontrato i funzionari della Casa Bianca in quelli che sono stati descritti come produttivi colloqui di tregua — il primo contatto ad alto livello dall'attrito precedente tra Anthropic e il Pentagono
.
Tra le figure chiave nei successivi colloqui ad alto livello figurano il Segretario al Commercio statunitense Howard Lutnick, il Direttore della Cyber Sicurezza Nazionale Sean Cairncross e il co-fondatore di Anthropic Tom Brown . L'amministrazione ha coordinato le attività tra Commercio, Tesoro e Casa Bianca per il caso di prova Fable 5
.
Il progetto centrale emerso da questi colloqui è un quadro di conformità unificato per valutare la gravità delle vulnerabilità di sicurezza — in particolare i jailbreak — nei modelli di IA all'avanguardia . Il framework è progettato per creare parametri di riferimento comuni per valutare se un difetto di sicurezza giustifichi un intervento governativo
.
Al centro dello sforzo c'è un sistema di valutazione unificato per i jailbreak. Sebbene non siano state rilasciate pubblicamente etichette ufficiali (ad esempio, "Critico", "Alto", "Medio", "Basso") o una rubrica dettagliata, il framework valuta presumibilmente le vulnerabilità secondo tre criteri di valutazione del rischio :
L'obiettivo del governo è utilizzare questo sistema di valutazione per stabilire soglie di rischio chiare e predefinite che determinerebbero automaticamente se imporre controlli all'esportazione, richiedere misure correttive o bloccare la distribuzione — piuttosto che agire in modo ad hoc dopo una crisi .
L'obiettivo generale del governo è passare da un intervento reattivo, guidato dalla crisi, a un sistema basato su regole . Sviluppando congiuntamente il quadro di valutazione e le soglie di rischio con Anthropic, la Casa Bianca mira a:
Incertezza chiave: Non sono stati rilasciati pubblicamente criteri dettagliati, ambito o tempistiche per il framework. I tre criteri di valutazione del rischio (protezioni aggirate, capacità esposte, impatto nel mondo reale) sono stati riportati da più fonti, ma la metodologia di punteggio specifica non è stata resa nota .
Lo sviluppo del framework USA-Anthropic avviene sullo sfondo delle discussioni del G7 sugli standard di sicurezza dell'IA. Il G7 sta lavorando per armonizzare i parametri di riferimento internazionali per la valutazione dei rischi dell'IA all'avanguardia . Ci si aspetta che il sistema di valutazione unificato che la Casa Bianca e Anthropic stanno costruendo informi — e sia informato da — quei più ampi colloqui multilaterali, sebbene i risultati specifici del G7 rimangano in fase di negoziazione
.
Lo sviluppo del framework segna una svolta significativa nella politica statunitense sull'IA. Solo pochi giorni prima dei controlli all'esportazione, Amodei aveva pubblicato un saggio politico in cui sosteneva che i governi dovrebbero detenere l'autorità legale obbligatoria per bloccare o invertire la distribuzione di modelli di IA all'avanguardia che non superano i test di sicurezza indipendenti . La crisi del 12 giugno ha messo quel principio a una prova inaspettatamente conflittuale.
La domanda chiave che rimane aperta: come definire il confine tra una vulnerabilità stretta e gestibile e un rischio sistemico che richiede un intervento governativo. La risposta plasmerà non solo le future versioni di Anthropic, ma anche il panorama normativo più ampio per lo sviluppo dell'IA all'avanguardia.
Comments
0 comments