Blant AI-forskere, både i næringslivet og akademia, er det bred enighet om at et slikt krav ikke lar seg innfri med dagens teknologi . Grunnen ligger i selve matematikken bak store språkmodeller (LLM-er).
Jailbreak-paradokset. En vitenskapelig artikkel på arXiv fra 2024 (oppdatert mai 2026) beviser formelt to paradokser: For det første er det umulig å konstruere en perfekt jailbreak-klassifiserer. For det andre kan en svakere modell ikke konsekvent oppdage om en sterkere modell er jailbreaket . Dette er ikke en «bug» som kan fikses – det er en matematisk begrensning som ligger innebygd i måten AI-modellers atferd blir innrettet på.
En uendelig kapprustning. Jailbreaking er i bunn og grunn et «adversarial»-problem der angripere og forsvarere stadig utvikler nye triks. Så snart én type jailbreak blir tettet, dukker det opp nye varianter – enten det gjelder mønstre i spørsmålene man stiller, måter å kode inn data på eller flerstegs angrep som gradvis lurer modellen til å bryte reglene .
Autonome jailbreak-agenter. En studie publisert i Nature Communications i mars 2026 viste at store resonneringsmodeller i seg selv kan opptre som autonome jailbreak-agenter. I forsøkene oppnådde de en suksessrate på 97,14 prosent på tvers av alle modellkombinasjoner som ble testet . Angrepsflaten vokser, den blir ikke mindre.
Ekspertenes dom. Sikkerhetseksperter understreker at et krav om å stenge alle jailbreaks «ville stoppe all utrulling av avanserte AI-modeller» – standarden er ikke et mål man kan nå med mer finpussing, men en umulighet .
Presset mot Anthropic har økt gradvis:
Tidligere konflikt med Pentagon. Anthropic var allerede i en disputt med myndighetene, som hadde klassifisert selskapet som en «risiko i forsyningskjeden» og bedt føderale etater om å begrense eller avslutte bruken av Anthropics produkter .
Amazons rolle. Ifølge flere kilder varslet Amazons konsernsjef Andy Jassy Det hvite hus om spesifikke sikkerhetsproblemer med Fable 5, noe som fremskyndet regjeringens inngripen . Minst fem andre selskaper skal også ha slått alarm
.
Den brå stengingen. Klokken 17.21 Eastern Time den 12. juni mottok Anthropic brevet fra handelsdepartementet. Innen omtrent klokken 22.00 var begge modellene slått av for alle kunder over hele verden. Det var første gang USA anvendte eksportkontroll på en kommersiell AI-modell som allerede var i offentlig bruk .
Null-jailbreak-ultimatumet. Etter stengingen eskalerte Det hvite hus kravet fra en eksportrestriksjon til en sikkerhetsstandard som ifølge eksperter er teknisk umulig å oppfylle, nå som forutsetning for fremtidige lanseringer .
TechCrunch karakteriserte hele episoden som et politisk spill som «aldri handlet om en AI-jailbreak» – et signal om at regjeringen er villig til å bestemme ensidig når en AI-modell er for farlig til å være i drift .
Ifølge flere medier er posisjonen fra Det hvite hus at Fable 5-modellen bare kan returnere dersom Anthropic gjør jailbreaks umulige . Det er ikke snakk om gradvise forbedringer eller et system for å håndtere sårbarheter – det er et binært krav: enten finnes det ingen jailbreaks, eller så kan modellen ikke lanseres
.
Anthropic har på sin side svart at «ingen testpersoner så langt har klart å finne en universell jailbreak» og at en total mangel på jailbreaks ikke er mulig – verken for dem eller noe annet selskap . Selskapet påpeker også at det «ikke har mottatt informasjon om en bekymringsfull, ikke-universell potensiell jailbreak som har ført til et skadelig resultat»
.
Ifølge rapporter fra flere medier står Anthropic overfor tre hovedstrategier:
1. Etterlevelse og forhandling. Administrerende direktør Dario Amodei møtte tjenestemenn fra Det hvite hus 15. juni for å forhandle frem en felles ramme for vurdering av sårbarheter – en ramme som erstatter det absolutte null-kravet med en trinnvis standard for alvorlighetsgrad . Myndighetene og Anthropic jobber ifølge kilder med å utvikle et slikt system
. Dette er den veien selskapet ser ut til å følge for øyeblikket.
2. Rettslig eller politisk utfordring. Anthropic kan gå til retten for å bestride eksportkontrollen, med argumenter om at myndighetene overskred sin myndighet eller brøt rettsvernet ved å anvende eksportkontroll på et allerede offentlig tilgjengelig kommersielt produkt . Dette vil være et høyt spill som kan sette viktig presedens.
3. Omstrukturering eller flytting. Selskapet kan begrense lanseringer til land med mer forutsigbare reguleringer, eller splitte opp strukturen slik at produktene som retter seg mot det globale markedet, skilles fra dem som er for det amerikanske. Noen analytikere kaller dette «kjernefysisk alternativet» – det ville endre Anthropics forretningsmodell fundamentalt.
Konflikten mellom Det hvite hus og Anthropic tydeliggjør tre grunnleggende spenninger som vil definere fremtiden for avansert AI:
Teknisk virkelighet vs. regulatorisk absolutisme. Myndighetene krever en garanti – null jailbreaks – som datavitenskapen sier er umulig . Hvis administrasjonen insisterer på denne standarden, har den i praksis veto over enhver lansering av en avansert AI-modell, fordi intet laboratorium kan innfri kravet.
Eksportkontroll på offentlig programvare. For første gang har USA anvendt eksportkontroll på en kommersiell AI-modell som allerede var tilgjengelig for offentligheten . Dette skaper presedens for at ethvert AI-laboratorium kan bli beordret til å stenge et produkt over natten, basert på en ensidig nasjonal sikkerhetsvurdering.
Uavhengighet vs. reell overoppsyn. Anthropic ble grunnlagt med et uttalt mål om sikkerhet og uavhengighet. Det hvite hus' aksjon viser at selv de mest «ansvarlige» laboratoriene kan tvinges til å rette seg etter teknisk urealistiske krav – eller få produktene sine slått av . Som Bloomberg skrev, markerer blokkeringen «en snuoperasjon fra USA» og «en advarsel til Silicon Valley» om at epoken med selvregulert lansering av avanserte AI-modeller kan være over
.
Comments
0 comments