Het draait allemaal om een concept dat in de AI-wereld bekendstaat als een 'jailbreak': een methode om de ingebouwde veiligheidsbarrières van een taalmodel te omzeilen. De Amerikaanse autoriteiten stellen dat er bewijs is dat Fable 5 via zo'n jailbreak ingezet zou kunnen worden voor autonoom cyberbeveiligingsonderzoek – oftewel, dat de AI zelfstandig op zoek kan gaan naar digitale zwakke plekken .
Anthropic betwist de ernst van dit bewijs. Volgens het bedrijf heeft de regering alleen mondeling bewijs geleverd voor een 'potentieel smalle, niet-universele jailbreak'. In de praktijk zou dat neerkomen op het vragen aan het model om een specifieke code te lezen en fouten te herstellen – een scenario dat aanzienlijk minder apocalyptisch is dan de regering schetst .
Mogelijk hebben de eigen veiligheidswaarschuwingen van Anthropic onbedoeld olie op het vuur gegooid. Het bedrijf had al eerder erkend dat Mythos 5, het krachtigste model bedoeld voor beperkt gebruik, aanzienlijke cyberveiligheidsrisico's met zich meebracht. Dit leidde ertoe dat het Witte Huis speciale beschermingsmaatregelen instelde voor federale instanties die al met het model werkten . Fable 5 werd vervolgens gelanceerd als een veiligere, 'tamme' versie die schadelijke verzoeken zou moeten weigeren
. Dat de regering dagen later alsnog zo drastisch ingreep, maakt duidelijk dat Washington weinig vertrouwen had in die ingebouwde vangrails.
Het meest controversiële onderdeel van de richtlijn is de reikwijdte. De Amerikaanse minister van Handel, Howard Lutnick, schreef in zijn brief aan CEO Dario Amodei expliciet dat de exportbeperking van toepassing is op "elke buitenlander, of die zich nu binnen of buiten de Verenigde Staten bevindt, inclusief buitenlandse werknemers van Anthropic" .
Dit onderdeel is juridisch munitie uit het zware geschut van de Amerikaanse exportwetgeving. Onder de zogenaamde 'deemed-export'-regels is het delen van gecontroleerde technologie met een buitenlander op Amerikaanse bodem wettelijk gelijk aan het exporteren ervan naar het buitenland . Voor het eerst worden deze regels nu toegepast op een specifiek groot taalmodel, waarmee de modellen in dezelfde categorie worden geplaatst als wapens of geavanceerde defensietechnologie
.
Voor Anthropic betekende dit dat zelfs de onderzoekers van het 'Glass Wing'-project – het interne team dat werkt aan de veiligheid van dit soort geavanceerde modellen – geen toegang meer mochten krijgen als ze niet over de Amerikaanse nationaliteit of een permanente verblijfsvergunning beschikten . Doordat het verbod tot in de eigen serverruimtes gold, was een gedeeltelijke afsluiting onmogelijk. De enige uitweg om volledig aan de wet te voldoen, was de stekker er voor iedereen uit trekken
.
Anthropic koos eieren voor zijn geld en voldeed binnen enkele uren aan het bevel, maar de toon van de communicatie is opvallend stellig. "Wij geloven dat dit een misverstand is en werken eraan om de toegang zo snel mogelijk te herstellen," aldus de publieke verklaring van het bedrijf .
Ondertussen blijven alle andere diensten van Anthropic, waaronder de razend populaire chatbot Claude, gewoon online . Het bedrijf onderhandelt momenteel met de autoriteiten om de blokkade op te heffen, maar zolang er geen oplossing is, staan de twee krachtigste AI-modellen ter wereld werkloos aan de zijlijn – het slachtoffer van een geopolitiek steekspel waarvan de uitkomst de spelregels voor de hele AI-industrie zal bepalen.
Comments
0 comments