Vientivalvonnan välitön laukaiseva tekijä oli raportoitu jailbreak – menetelmä, jolla mallien turvatoimet voidaan kiertää. Osapuolten näkemykset sen vakavuudesta erosivat kuitenkin jyrkästi.
Erimielisyys kärjistyi nopeasti. Useiden raporttien mukaan Amodei vastasi voimakkaasti puheluissa hallinnon virkamiesten kanssa kuvaillen hallituksen huolta väärinkäsitykseksi, ja neuvottelut olivat lähes katketa kokonaan .
Valkoinen talo nimesi Fable 5:n testitapaukseksi uusille tekoälyn toimeenpanomääräyksen suojakaiteille ja koordinoi toimia kauppaministeriön, valtiovarainministeriön ja Valkoisen talon välillä . Hallinto pelkäsi, että mallien kyvykkyydet voisivat mahdollistaa Kiinan pääsyn kyberturvallisuuden hyökkäystyökaluihin ja muihin vaarallisiin kaksoiskäyttöteknologioihin
.
Päivien sisällä vientivalvontakriisistä Valkoinen talo ja Anthropic siirtyivät yhteenotosta jäsenneltyyn neuvotteluun . 17. huhtikuuta 2026 Amodei tapasi Valkoisen talon virkamiehiä neuvotteluissa, joita kuvattiin tuottaviksi aseleponeuvotteluiksi – ensimmäinen korkean tason kontakti sitten aiemman kitkan Anthropicin ja Pentagonin välillä
.
Keskeisiä hahmoja myöhemmissä korkean tason keskusteluissa olivat Yhdysvaltain kauppaministeri Howard Lutnick, kansallinen kyberjohtaja Sean Cairncross ja Anthropicin perustajaosakas Tom Brown . Hallinto koordinoi toimia kauppaministeriön, valtiovarainministeriön ja Valkoisen talon välillä Fable 5:n testitapauksen osalta
.
Keskustelujen keskeinen hanke on yhtenäinen sääntelykehys tekoälymallien turvallisuuspuutteiden – erityisesti jailbreakien – vakavuuden arvioimiseksi . Kehys on suunniteltu luomaan yhteiset vertailuarvot sen arvioimiseksi, oikeuttaako turvallisuusvirhe hallituksen toimenpiteisiin
.
Järjestelmän keskiössä on yhtenäinen jailbreak-luokitusjärjestelmä. Vaikka virallisia luokituksia (esim. ”Kriittinen”, ”Korkea”, ”Keskitaso”, ”Matala”) tai yksityiskohtaista arviointiohjetta ei ole julkistettu, kehyksen kerrotaan arvioivan haavoittuvuuksia kolmen riskinarviointikriteerin perusteella :
Hallituksen tavoitteena on käyttää tätä luokitusjärjestelmää selkeiden, ennalta määritettyjen riskikynnysten luomiseen, jotka automaattisesti määräisivät, milloin asettaa vientivalvontaa, vaatia lievennystoimenpiteitä tai estää käyttöönotto – sen sijaan, että toimittaisiin ad hoc -periaatteella kriisin jälkeen .
Hallituksen yleisenä tavoitteena on siirtyä reaktiivisesta, kriisivetoisesta interventiosta sääntöpohjaiseen järjestelmään . Kehittämällä luokitusjärjestelmän ja riskikynnykset yhdessä Anthropicin kanssa Valkoinen talo pyrkii:
Keskeinen epävarmuus: Kehyksen yksityiskohtaisia kriteerejä, laajuutta tai aikataulua ei ole julkistettu. Kolme riskinarviointikriteeriä (ohitetut suojatoimet, paljastuneet kyvykkyydet, todellinen maailmanvaikutus) on raportoitu useissa lähteissä, mutta varsinaista pisteytysmetodologiaa ei ole julkistettu .
Yhdysvaltain ja Anthropicin kehyksen kehittäminen tapahtuu G7:n tekoälyn turvallisuusstandardeja koskevien keskustelujen taustalla. G7 on työskennellyt harmonisoitujen kansainvälisten vertailuarvojen luomiseksi tekoälyn kärkikyvykkyyksien riskien arvioimiseksi . Valkoisen talon ja Anthropicin rakentaman yhtenäisen luokitusjärjestelmän odotetaan vaikuttavan – ja saavan vaikutteita – näistä laajemmista monenvälisistä keskusteluista, vaikka G7:n tulokset ovatkin vielä neuvotteluvaiheessa
.
Kehyksen kehittäminen merkitsee merkittävää käännekohtaa Yhdysvaltain tekoälypolitiikassa. Vain päiviä ennen vientivalvontaa Amodei oli julkaissut politiikkaesseen, jossa hän väitti, että hallituksilla pitäisi olla lain mukaan oikeus estää tai peruuttaa sellaisten tekoälymallien käyttöönotto, jotka eivät läpäise itsenäistä turvallisuustestausta . 12. kesäkuuta 2026 kriisi asetti tämän periaatteen odottamattoman konfrontatiiviseen testiin.
Keskeinen avoin kysymys: miten määritellä raja kapean, hallittavan haavoittuvuuden ja systeemisen riskin välillä, joka oikeuttaa hallituksen toimet. Vastaus muokkaa paitsi Anthropicin tulevia julkaisuja myös tekoälyn kärkikyvykkyyksien kehittämistä koskevaa sääntelymaisemaa laajemmin.
Comments
0 comments