Den omedelbara utlösaren för exportkontrollerna var en rapporterad jailbreak – en metod för att kringgå modellernas säkerhetsspärrar. Men de två sidorna var djupt oense om hur allvarligt hotet var.
Oenigheten eskalerade snabbt. Enligt flera rapporter högg Amodei ifrån kraftfullt under samtalen med regeringstjänstemän, beskrev deras oro som ett missförstånd, och vid ett tillfälle bröt nästan förhandlingarna samman helt .
Vita huset utsåg Fable 5 till en testcase för sina nya AI-säkerhetsriktlinjer och samordnade insatser mellan handelsdepartementet, finansdepartementet och Vita huset självt . Administrationen fruktade att modellernas förmågor skulle kunna ge Kina tillgång till avancerade cybersäkerhetsverktyg och andra farliga tekniker med dubbla användningsområden
.
Inom några dagar efter exportkontrollkrisen skiftade Vita huset och Anthropic från konfrontation till strukturerade förhandlingar . Den 17 april 2026 möttes Amodei och Vita husets tjänstemän i vad som beskrevs som produktiva fredssamtal – den första kontakten på hög nivå sedan tidigare friktion mellan Anthropic och Pentagon
.
Nyckelpersoner i de efterföljande högprofilerade diskussionerna inkluderar USA:s handelsminister Howard Lutnick, nationella cyberdirektören Sean Cairncross och Anthropics medgrundare Tom Brown . Administrationen har samordnat insatser mellan handelsdepartementet, finansdepartementet och Vita huset för Fable 5-testet
.
Huvudprojektet som vuxit fram ur dessa samtal är ett enhetligt ramverk för regelefterlevnad som ska utvärdera allvarlighetsgraden av säkerhetsbrister – särskilt jailbreaks – i avancerade AI-modeller . Ramverket är designat för att skapa gemensamma riktmärken för att bedöma om en säkerhetsbrist motiverar statlig intervention
.
Centralt i arbetet är ett enhetligt klassificeringssystem för jailbreaks. Även om inga officiella etiketter (t.ex. "Kritisk," "Hög," "Medel," "Låg") eller en detaljerad poängsättningsmall har offentliggjorts, bedömer ramverket enligt uppgift sårbarheter utifrån tre riskbedömningskriterier :
Regeringens mål är att använda detta klassificeringssystem för att fastställa tydliga, förutbestämda risktrösklar som automatiskt skulle avgöra om exportkontroller ska införas, åtgärder krävas eller lansering blockeras – istället för att agera ad hoc efter en kris .
Det övergripande målet för regeringen är att gå från reaktiva, krisdrivna insatser till ett regelbaserat system . Genom att tillsammans med Anthropic utveckla klassificeringsramverket och risktrösklarna vill Vita huset:
Viktig osäkerhet: Inga detaljerade kriterier, omfattning eller tidplan för ramverket har offentliggjorts. De tre riskbedömningskriterierna (kringgångna skydd, exponerade förmågor, verklig påverkan) har rapporterats av flera medier, men den specifika poängsättningsmetodiken har inte offentliggjorts .
Utvecklingen av det amerikansk-anthropiska ramverket sker mot bakgrund av G7-diskussioner om AI-säkerhetsstandarder. G7 har arbetat mot harmoniserade internationella riktmärken för att utvärdera risker med avancerad AI . Det enhetliga klassificeringssystem som Vita huset och Anthropic bygger förväntas både informera och påverkas av dessa bredare multilaterala samtal, även om specifika G7-utfall fortfarande förhandlas
.
Ramverkets utveckling markerar en betydande kursändring i USA:s AI-politik. Bara dagar före exportkontrollerna hade Amodei publicerat en policyessä där han argumenterade för att regeringar borde ha lagstadgad befogenhet att blockera eller återkalla lanseringen av avancerade AI-modeller som inte klarar oberoende säkerhetstester . Juni-krisen satte den principen på ett oväntat konfrontativt prov.
Den centrala frågan som fortfarande är öppen: hur man drar gränsen mellan en smal, hanterbar sårbarhet och en systemrisk som motiverar statlig intervention. Svaret kommer inte bara att forma Anthropics framtida lanseringar utan också det bredare regulatoriska landskapet för utveckling av avancerad AI.
Comments
0 comments