Penyelidik AI merentasi industri dan akademik secara meluas bersetuju bahawa keperluan "zero-jailbreak" tidak boleh dicapai dengan kaedah semasa . Sebabnya terletak pada asas matematik bagaimana model bahasa besar berfungsi.
Paradoks Jailbreak. Kertas kerja arXiv 2024 (dikemas kini Mei 2026) secara rasmi membuktikan dua paradoks: pertama, adalah mustahil untuk membina pengelas jailbreak yang sempurna, dan kedua, model yang lebih lemah tidak dapat mengesan secara konsisten sama ada model yang lebih kuat telah di'jailbreak' . Ini bukan pepijat yang boleh diperbaiki — ia adalah had matematik yang wujud dalam cara penjajaran ditakrifkan.
Perlumbaan senjata adversarial, bukan masalah yang boleh diselesaikan. Jailbreaking adalah masalah adversarial yang asas. Penyerang sentiasa menemui corak prompt baharu, helah pengekodan, dan strategi berbilang pusingan yang mengelak penapis sedia ada. Sebaik sahaja satu kelas jailbreak ditambal, varian baharu muncul .
Penskalaan jailbreaking autonomi. Satu kajian Mac 2026 yang diterbitkan dalam Nature Communications mendapati bahawa model penaakulan besar kini boleh bertindak sebagai ejen jailbreak autonomi, mencapai kadar kejayaan keseluruhan 97.14% merentas semua kombinasi model yang diuji . Permukaan serangan semakin berkembang, bukan mengecut.
Konsensus pakar. Pakar keselamatan berkata menyekat jailbreak sepenuhnya "akan menghentikan semua penggunaan AI perbatasan" — standard itu bukan sasaran pembetulan pepijat tetapi kemustahilan bukti kewujudan .
Tuntutan ini tidak timbul dalam vakum. Ia mengikuti arus jelas peningkatan tekanan kerajaan terhadap Anthropic:
Konflik Pentagon sebelumnya. Anthropic sudah pun terlibat dalam pertikaian dengan kerajaan A.S. mengenai interaksinya dengan Pentagon, yang telah menetapkan syarikat itu sebagai "risiko rantaian bekalan," mengarahkan agensi persekutuan untuk menghadkan atau menghentikan penggunaan produknya .
Pencetus Amazon. Ketua Pegawai Eksekutif Amazon Andy Jassy dilaporkan memberitahu Rumah Putih tentang kebimbangan keselamatan khusus dengan Fable 5, mempercepatkan campur tangan pentadbiran . Sekurang-kurangnya lima syarikat lain juga membunyikan penggera
.
Penutupan mengejut. Pada 12 Jun jam 5:21 petang ET, Anthropic menerima surat Jabatan Perdagangan. Menjelang kira-kira 10 malam, kedua-dua model ditutup untuk semua pelanggan di seluruh dunia — menandakan kali pertama A.S. menggunakan kawalan eksport ke atas model AI komersial yang sudah digunakan secara awam .
Ultimatum zero-jailbreak. Selepas penutupan, Rumah Putih meningkatkan daripada sekatan eksport kepada mengenakan standard keselamatan yang mustahil secara teknikal sebagai prasyarat untuk pelepasan masa depan .
TechCrunch mencirikan keseluruhan episod ini sebagai langkah politik yang "tidak pernah mengenai jailbreak AI" — isyarat bahawa kerajaan sanggup menentukan secara unilateral bila model AI terlalu berbahaya untuk beroperasi .
Kedudukan Rumah Putih, seperti yang dilaporkan oleh pelbagai saluran, ialah model Fable 5 Anthropic hanya boleh kembali jika syarikat itu menjadikan jailbreak mustahil . Ini bukan permintaan untuk penambahbaikan berperingkat atau proses pengurusan kelemahan bertingkat — ia adalah binari mutlak: sama ada tiada jailbreak wujud di mana-mana, atau model tidak boleh digunakan
.
Anthropic membalas balas, menyatakan bahawa "tiada penguji lagi dapat mencari jailbreak universal" dan bahawa pengelakan total mana-mana jailbreak tidak mungkin untuk mereka atau mana-mana syarikat lain . Syarikat itu juga menyatakan ia "tidak pun menerima pendedahan tentang potensi jailbreak bukan universal yang membimbangkan yang membawa kepada hasil yang berbahaya"
.
Berdasarkan laporan daripada pelbagai saluran, Anthropic berdepan tiga laluan strategik yang luas:
1. Pematuhan dan rundingan. Ketua Pegawai Eksekutif Dario Amodei bertemu dengan pegawai Rumah Putih pada 15 Jun untuk merundingkan rangka kerja penilaian kelemahan yang boleh diterima bersama — satu yang menggantikan mutlak zero-jailbreak dengan standard keterukan bertingkat . Rumah Putih dan Anthropic dilaporkan bekerjasama dalam rangka kerja untuk menilai keseriusan kelemahan keselamatan
. Ini adalah laluan yang Anthropic nampaknya sedang usahakan sekarang.
2. Cabaran kehakiman atau politik. Anthropic boleh mencabar kawalan eksport di mahkamah, dengan alasan bahawa kerajaan melebihi kuasa undang-undangnya atau melanggar prosedur wajar dengan menggunakan kawalan eksport secara retrospektif ke atas produk komersial yang tersedia secara awam . Ini akan menjadi langkah berisiko tinggi dan berpertaruhan tinggi yang boleh menetapkan duluan penting.
3. Menyusun semula atau memindahkan operasi. Anthropic boleh menyekat pelepasan model ke bidang kuasa dengan persekitaran kawal selia yang lebih boleh diramal, atau mengkonfigurasi semula struktur korporatnya untuk memisahkan produk yang berdepan A.S. daripada produk global. Sesetengah penganalisis menggambarkan ini sebagai "pilihan nuklear" yang akan mengubah model perniagaan Anthropic secara asas.
Pertikaian ini mengkristalkan tiga ketegangan asas yang akan mentakrifkan masa depan AI perbatasan:
Realiti teknikal vs. absolutisme kawal selia. Kerajaan menuntut jaminan — zero jailbreaks — yang sains komputer katakan mustahil . Jika pentadbiran berkeras dengan standard ini, ia secara efektif mempunyai veto ke atas mana-mana pelepasan model perbatasan, memandangkan tiada makmal boleh memenuhi bar itu.
Kawalan eksport ke atas perisian awam. Buat pertama kalinya, A.S. telah menggunakan kawalan eksport ke atas model AI komersial yang sudah boleh diakses secara awam . Ini menetapkan duluan bahawa mana-mana makmal AI boleh diarahkan untuk menutup produk dalam sekelip mata berdasarkan penentuan keselamatan negara unilateral.
Kebebasan vs. pengawasan de facto. Anthropic ditubuhkan dengan penekanan dipacu misi terhadap keselamatan dan kebebasan. Tindakan Rumah Putih menunjukkan bahawa walaupun makmal yang paling "bertanggungjawab" boleh dipaksa untuk mematuhi standard kerajaan yang tidak realistik secara teknikal — atau produk mereka hanya dimatikan . Seperti yang dinyatakan oleh Bloomberg, sekatan itu menandakan "pembalikan A.S." dan "amaran kepada Silicon Valley" bahawa era penggunaan AI perbatasan yang dikawal sendiri mungkin sudah berakhir
.
Comments
0 comments