Pencetus segera untuk kawalan eksport adalah laporan mengenai jailbreak — satu kaedah untuk memintas pagar keselamatan model. Tetapi kedua-dua pihak tidak bersetuju secara mendadak mengenai tahap keterukannya.
Pertikaian itu meningkat dengan pantas. Menurut pelbagai laporan, Amodei menolak keras dalam panggilan dengan pegawai pentadbiran, menggambarkan kebimbangan kerajaan sebagai salah faham, dan pada satu ketika rundingan hampir gagal sepenuhnya .
White House menetapkan Fable 5 sebagai kes ujian untuk pagar keselamatan perintah eksekutif AI baharunya, menyelaraskan Jabatan Perdagangan, Perbendaharaan, dan White House sendiri . Pentadbiran itu bimbang keupayaan model itu boleh membolehkan akses China kepada alat kesalahan keselamatan siber dan teknologi dwiguna berbahaya yang lain
.
Dalam beberapa hari selepas krisis kawalan eksport, White House dan Anthropic beralih dari konfrontasi ke rundingan berstruktur . Pada 17 April 2026, Amodei bertemu dengan pegawai White House dalam apa yang digambarkan sebagai rundingan gencatan senjata yang produktif — hubungan peringkat kanan pertama sejak geseran awal antara Anthropic dan Pentagon
.
Tokoh penting dalam perbincangan peringkat tinggi berikutnya termasuk Menteri Perdagangan AS Howard Lutnick, Pengarah Siber Nasional Sean Cairncross, dan pengasas bersama Anthropic Tom Brown . Pentadbiran telah menyelaraskan Jabatan Perdagangan, Perbendaharaan, dan White House untuk kes ujian Fable 5
.
Projek utama yang muncul dari rundingan ini adalah rangka kerja pematuhan bersatu untuk menilai tahap keterukan kelemahan keselamatan — terutamanya jailbreak — dalam model AI sempadan . Rangka kerja ini direka untuk mewujudkan penanda aras bersama untuk menilai sama ada kecacatan keselamatan mewajarkan campur tangan kerajaan
.
Teras kepada usaha ini adalah sistem gred bersatu untuk jailbreak. Walaupun tiada label rasmi (cth., "Kritikal," "Tinggi," "Sederhana," "Rendah") atau rubrik terperinci telah dikeluarkan secara terbuka, rangka kerja itu dilaporkan menilai kelemahan sepanjang tiga kriteria penilaian risiko :
Matlamat kerajaan adalah menggunakan sistem gred ini untuk mewujudkan ambang risiko yang jelas dan telah ditetapkan yang secara automatik akan menentukan sama ada untuk mengenakan kawalan eksport, memerlukan mitigasi, atau menyekat penggunaan — daripada bertindak secara ad hoc selepas krisis .
Objektif utama kerajaan adalah untuk bergerak dari campur tangan reaktif yang didorong oleh krisis kepada sistem berasaskan peraturan . Dengan bersama-sama membangunkan rangka kerja penggredan dan ambang risiko dengan Anthropic, White House menyasarkan untuk:
Ketidakpastian utama: Tiada kriteria terperinci, skop, atau garis masa untuk rangka kerja itu telah dikeluarkan secara terbuka. Tiga kriteria penilaian risiko (perlindungan yang diatasi, keupayaan yang terdedah, kesan dunia sebenar) telah dilaporkan oleh pelbagai saluran tetapi metodologi pemarkahan khusus belum didedahkan .
Pembangunan rangka kerja AS-Anthropic berlaku dengan latar belakang perbincangan G7 mengenai piawaian keselamatan AI. G7 telah berusaha ke arah penanda aras antarabangsa yang harmoni untuk menilai risiko AI sempadan . Sistem gred bersatu yang dibina oleh White House dan Anthropic dijangka akan memaklumkan — dan dimaklumkan oleh — perbincangan pelbagai hala yang lebih luas itu, walaupun hasil G7 yang spesifik masih dalam rundingan
.
Perkembangan rangka kerja ini menandakan perubahan ketara dalam dasar AI AS. Hanya beberapa hari sebelum kawalan eksport, Amodei telah menerbitkan esei dasar yang berhujah bahawa kerajaan harus memegang kuasa undang-undang mandatori untuk menyekat atau membalikkan penggunaan model AI sempadan yang gagal ujian keselamatan bebas . Krisis 12 Jun menguji prinsip itu dalam ujian konfrontasi yang tidak dijangka.
Persoalan utama yang masih terbuka: bagaimana untuk menentukan garis antara kelemahan sempit yang boleh diurus dan risiko sistemik yang mewajarkan campur tangan kerajaan. Jawapannya akan membentuk bukan sahaja keluaran masa depan Anthropic tetapi juga landskap pengawalseliaan yang lebih luas untuk pembangunan AI sempadan.
Comments
0 comments