De directe aanleiding voor de exportcontroles was een gemelde jailbreak — een methode om de veiligheidsbarrières van de modellen te omzeilen. Maar beide partijen waren het fundamenteel oneens over de ernst ervan.
Het conflict escaleerde snel. Volgens meerdere berichten verzette Amodei zich krachtig in telefoongesprekken met ambtenaren. Hij omschreef de zorgen van de overheid als een misverstand. Op een gegeven moment stonden de onderhandelingen op het punt volledig vast te lopen .
Het Witte Huis wees Fable 5 aan als testcase voor de nieuwe AI-richtlijnen van het Witte Huis. De coördinatie liep via het ministerie van Handel, het ministerie van Financiën en het Witte Huis zelf . De regering vreesde dat de mogelijkheden van de modellen Chinese toegang zouden kunnen verschaffen tot middelen voor cyberbeveiligingsaanvallen en andere gevaarlijke dual-use technologieën
.
Binnen enkele dagen na de exportcontrolecrisis schakelden het Witte Huis en Anthropic van confrontatie over naar gestructureerde onderhandelingen . Op 17 april 2026 ontmoette Amodei hoge functionarissen van het Witte Huis in wat werd omschreven als productieve wapenstilstandsgesprekken — het eerste contact op hoog niveau sinds eerdere wrijving tussen Anthropic en het Pentagon
.
Belangrijke figuren in de daaropvolgende gesprekken op hoog niveau zijn onder meer de Amerikaanse minister van Handel Howard Lutnick, nationaal cyberdirecteur Sean Cairncross en Anthropic-medeoprichter Tom Brown . De regering coördineerde de Fable 5-testcase via de departementen van Handel en Financiën en het Witte Huis
.
Het centrale project dat uit deze gesprekken is voortgekomen, is een gezamenlijk nalevingskader voor het evalueren van de ernst van veiligheidskwetsbaarheden — met name jailbreaks — in geavanceerde AI-modellen . Het kader is ontworpen om gemeenschappelijke benchmarks te creëren voor het beoordelen of een veiligheidsfout overheidsingrijpen rechtvaardigt
.
Centraal in de inspanning staat een uniform beoordelingssysteem voor jailbreaks. Hoewel er geen officiële labels (bijv. 'Kritiek', 'Hoog', 'Gemiddeld', 'Laag') of een gedetailleerde beoordelingssystematiek openbaar zijn gemaakt, beoordeelt het raamwerk naar verluidt kwetsbaarheden aan de hand van drie risicobeoordelingscriteria :
Het doel van de overheid is om dit beoordelingssysteem te gebruiken om duidelijke, vooraf gedefinieerde risicodrempels vast te stellen die automatisch bepalen of exportcontroles moeten worden opgelegd, mitigerende maatregelen nodig zijn of uitrol moet worden geblokkeerd — in plaats van ad-hoc na een crisis in te grijpen .
De overkoepelende doelstelling van de overheid is om over te stappen van reactieve, crisisgedreven interventie naar een regelsgestuurd systeem . Door het beoordelingskader en de risicodrempels samen met Anthropic te ontwikkelen, wil het Witte Huis:
Belangrijke onzekerheid: Er zijn geen gedetailleerde criteria, reikwijdte of tijdlijn voor het kader openbaar gemaakt. De drie risicobeoordelingscriteria (omzeilde beveiligingen, blootgestelde capaciteiten, impact in de praktijk) zijn door meerdere media gemeld, maar de specifieke beoordelingsmethodiek is dat niet .
De ontwikkeling van het Amerikaanse kader met Anthropic vindt plaats tegen de achtergrond van G7-gesprekken over AI-veiligheidsnormen. De G7 werkt aan geharmoniseerde internationale benchmarks voor het evalueren van geavanceerde AI-risico's . Naar verwachting zal het uniforme beoordelingssysteem dat het Witte Huis en Anthropic bouwen, deze bredere multilaterale besprekingen voeden en erdoor worden gevoed, hoewel specifieke G7-resultaten nog worden onderhandeld
.
De ontwikkeling van het kader markeert een belangrijke koerswijziging in het Amerikaanse AI-beleid. Slechts enkele dagen voor de exportcontroles had Amodei een beleidsessay gepubliceerd waarin hij betoogde dat overheden de dwingende wettelijke bevoegdheid moeten hebben om de uitrol van geavanceerde AI-modellen die niet door onafhankelijke veiligheidstesten komen, te blokkeren of terug te draaien . De crisis van 12 juni stelde dat principe op een onverwacht confronterende manier op de proef.
De belangrijkste vraag die nog openstaat: hoe de grens te bepalen tussen een beperkte, beheersbare kwetsbaarheid en een systemisch risico dat overheidsingrijpen rechtvaardigt. Het antwoord zal niet alleen de toekomstige releases van Anthropic bepalen, maar ook het bredere regelgevingslandschap voor de ontwikkeling van geavanceerde AI.
Comments
0 comments