Den umiddelbare udløser for eksportkontrollen var en rapporteret jailbreak – en metode til at omgå modellernes sikkerhedsforanstaltninger. Men de to sider var dybt uenige om, hvor alvorlig den var.
Uenigheden eskalerede hurtigt. Ifølge flere rapporter skød Amodei hårdt igen under telefonsamtaler med regeringsembedsmænd og beskrev regeringens bekymringer som en misforståelse, og på et tidspunkt brød forhandlingerne næsten helt sammen .
Hvidhuset udpegede Fable 5 som en testcase for sine nye AI-retningslinjer og koordinerede indsatsen på tværs af handelsministeriet, finansministeriet og Hvidhuset selv . Administrationen frygtede, at modellernes kapaciteter kunne give Kina adgang til cyberangrebsværktøjer og andre farlige teknologier med dobbelt anvendelse
.
I løbet af få dage efter eksportkontrol-krisen skiftede Hvidhuset og Anthropic fra konfrontation til strukturerede forhandlinger . Den 17. april 2026 mødtes Amodei med embedsmænd fra Hvidhuset i det, der blev beskrevet som produktive våbenhvileforhandlinger – den første kontakt på højt niveau siden tidligere friktion mellem Anthropic og Pentagon
.
Centrale personer i de efterfølgende diskussioner på højt niveau inkluderer den amerikanske handelsminister Howard Lutnick, den nationale cybersikkerhedsdirektør Sean Cairncross og Anthropic-medstifter Tom Brown . Administrationen har koordineret på tværs af handelsministeriet, finansministeriet og Hvidhuset for Fable 5-testcasen
.
Det centrale projekt, der er opstået fra disse samtaler, er en fælles overholdelsesramme til at vurdere alvoren af sikkerhedssårbarheder – især jailbreaks – i frontløbs-AI-modeller . Rammen er designet til at skabe fælles benchmarks for at vurdere, om en sikkerhedsbrist retfærdiggør statslig indgriben
.
Centralt i bestræbelserne er et fælles karaktersystem for jailbreaks. Selvom der ikke er offentliggjort officielle etiketter (f.eks. "Kritisk," "Høj," "Mellem," "Lav") eller en detaljeret rubrik, vurderer rammen angiveligt sårbarheder ud fra tre risikovurderingskriterier :
Regeringens mål er at bruge dette karaktersystem til at etablere klare, foruddefinerede risikotærskler, der automatisk ville afgøre, om der skal indføres eksportkontrol, kræves afhjælpning, eller om implementering skal blokeres – i stedet for at handle ad hoc efter en krise .
Det overordnede regeringsmål er at bevæge sig fra reaktiv, krisedrevet intervention til et regelbaseret system . Ved at udvikle karaktersystemet og risikotærsklerne i samarbejde med Anthropic sigter Hvidhuset mod at:
Væsentlig usikkerhed: Ingen detaljerede kriterier, omfang eller tidsplan for rammen er blevet offentliggjort. De tre risikovurderingskriterier (omgåede beskyttelser, eksponerede kapaciteter, virkelig indflydelse) er blevet rapporteret af flere medier, men den specifikke scoringsmetode er ikke blevet offentliggjort .
Udviklingen af den amerikansk-Anthropic-ramme finder sted på baggrund af G7-diskussioner om AI-sikkerhedsstandarder. G7 har arbejdet på at harmonisere internationale benchmarks til evaluering af frontløbs-AI-risici . Det fælles karaktersystem, som Hvidhuset og Anthropic er ved at opbygge, forventes at informere – og blive informeret af – disse bredere multilaterale samtaler, selvom specifikke G7-resultater stadig er under forhandling
.
Udviklingen af rammen markerer et betydeligt skift i amerikansk AI-politik. Blot få dage før eksportkontrollen havde Amodei offentliggjort et politisk essay, hvor han argumenterede for, at regeringer bør have obligatorisk juridisk myndighed til at blokere eller omgøre implementeringen af frontløbs-AI-modeller, der ikke består uafhængige sikkerhedstest . Krisen den 12. juni satte dette princip på en uventet konfrontatorisk prøve.
Det centrale spørgsmål, der forbliver åbent: hvordan man definerer grænsen mellem en snæver, håndterbar sårbarhed og en systemisk risiko, der retfærdiggør statslig indgriben. Svaret vil ikke kun forme Anthropics fremtidige udgivelser, men også det bredere reguleringslandskab for frontløbs-AI-udvikling.
Comments
0 comments