Peneliti AI dari industri maupun akademisi sepakat bahwa persyaratan zero jailbreak tidak bisa dicapai dengan metode saat ini . Alasannya berkaitan dengan fondasi matematika dari cara kerja model bahasa besar (LLM).
Paradoks Jailbreak. Sebuah makalah arXiv tahun 2024 (diperbarui Mei 2026) membuktikan dua paradoks secara formal: pertama, mustahil membangun pengklasifikasi jailbreak yang sempurna; kedua, model yang lebih lemah tidak bisa secara konsisten mendeteksi apakah model yang lebih kuat telah di-jailbreak . Ini bukan bug yang bisa diperbaiki—ini adalah batasan matematis yang melekat pada cara kerja alignment.
Perlombaan senjata tanpa akhir. Jailbreaking pada dasarnya adalah masalah adversarial. Penyerang terus-menerus menemukan pola prompt baru, trik encoding, dan strategi multi-putaran yang lolos dari filter yang ada. Begitu satu jenis jailbreak ditambal, varian baru langsung muncul .
Jailbreak yang bisa berjalan sendiri. Studi Maret 2026 di Nature Communications menemukan bahwa model penalaran besar kini bisa bertindak sebagai agen jailbreak otonom, dengan tingkat keberhasilan mencapai 97,14% di semua kombinasi model yang diuji . Permukaan serangannya semakin luas, bukan menyempit.
Konsensus para ahli. Pakar keamanan mengatakan memblokir semua jailbreak "akan menghentikan seluruh pengembangan AI frontier"—standar ini bukan target perbaikan bug, melainkan kemustahilan yang sudah terbukti secara eksistensial .
Tuntutan ini tidak muncul begitu saja. Ada rentetan peristiwa yang meningkatkan tekanan pemerintah terhadap Anthropic:
Konflik dengan Pentagon sebelumnya. Anthropic sudah berseteru dengan pemerintah AS terkait interaksinya dengan Pentagon. Pentagon bahkan menetapkan Anthropic sebagai "risiko rantai pasok" dan meminta instansi federal membatasi atau menghentikan penggunaan produknya .
Pemicu dari Amazon. CEO Amazon Andy Jassy dilaporkan memberi tahu Gedung Putih tentang kekhawatiran keamanan spesifik pada Fable 5, yang mempercepat intervensi pemerintah . Setidaknya lima perusahaan lain juga melaporkan kekhawatiran serupa
.
Penutupan mendadak. Pada 12 Juni pukul 17.21 ET, Anthropic menerima surat dari Departemen Perdagangan. Menjelang pukul 22.00, kedua model dimatikan untuk semua pelanggan di seluruh dunia—ini adalah pertama kalinya AS menerapkan kontrol ekspor ke model AI komersial yang sudah digunakan publik .
Ultimatum zero jailbreak. Setelah penutupan, Gedung Putih meningkat dari sekadar pembatasan ekspor menjadi menerapkan standar keamanan yang secara teknis mustahil sebagai prasyarat perilisan model ke depan .
TechCrunch menggambarkan seluruh kejadian ini sebagai langkah politik yang "tidak pernah benar-benar tentang jailbreak AI"—sinyal bahwa pemerintah bersedia secara sepihak menentukan kapan suatu model AI dianggap terlalu berbahaya untuk dioperasikan .
Posisi Gedung Putih, sebagaimana dilaporkan banyak media, adalah bahwa model Fable 5 milik Anthropic hanya bisa kembali jika perusahaan membuat jailbreak menjadi mustahil . Ini bukan permintaan perbaikan bertahap atau proses manajemen kerentanan berjenjang—ini adalah tuntutan biner absolut: tidak ada jailbreak sama sekali, atau model tidak boleh dirilis
.
Anthropic membantah. Mereka menyatakan "tidak ada penguji yang berhasil menemukan jailbreak universal" dan bahwa "penghindaran total terhadap segala bentuk jailbreak tidak mungkin dilakukan oleh mereka atau perusahaan mana pun" . Perusahaan juga mengatakan "bahkan belum menerima pengungkapan tentang potensi jailbreak non-universal yang mengkhawatirkan dan menghasilkan hasil yang berbahaya"
.
Berdasarkan laporan dari berbagai media, Anthropic menghadapi tiga jalur strategis:
1. Kepatuhan dan negosiasi. CEO Dario Amodei bertemu dengan pejabat Gedung Putih pada 15 Juni untuk menegosiasikan kerangka penilaian kerentanan yang bisa diterima bersama—yang menggantikan standar absolut zero jailbreak dengan standar tingkat keparahan . Gedung Putih dan Anthropic dilaporkan berkolaborasi dalam kerangka kerja untuk mengevaluasi keseriusan celah keamanan
. Ini adalah jalur yang saat ini ditempuh Anthropic.
2. Tantangan hukum atau politik. Anthropic bisa menggugat kontrol ekspor tersebut di pengadilan, dengan argumen bahwa pemerintah melampaui wewenang undang-undang atau melanggar due process dengan menerapkan kontrol ekspor secara retroaktif ke produk komersial yang sudah tersedia untuk publik . Ini adalah langkah berisiko tinggi yang bisa menjadi preseden penting.
3. Restrukturisasi atau relokasi operasi. Anthropic bisa membatasi perilisan model ke yurisdiksi dengan lingkungan regulasi yang lebih bisa diprediksi, atau mengatur ulang struktur perusahaan untuk memisahkan produk untuk AS dan produk global. Beberapa analis menyebut ini sebagai "opsi nuklir" yang akan mengubah model bisnis Anthropic secara fundamental.
Perselisihan ini mengkristalkan tiga ketegangan fundamental yang akan menentukan masa depan AI frontier:
Realitas teknis vs. absolutisme regulasi. Pemerintah menuntut jaminan—zero jailbreak—yang menurut ilmu komputer tidak mungkin . Jika pemerintahan bersikukuh pada standar ini, secara efektif mereka memiliki hak veto atas perilisan model frontier mana pun, karena tidak ada satu lab pun yang bisa memenuhinya.
Kontrol ekspor pada perangkat lunak publik. Untuk pertama kalinya, AS menerapkan kontrol ekspor ke model AI komersial yang sudah dapat diakses publik . Ini menciptakan preseden bahwa lab AI mana pun bisa diperintahkan mematikan produk dalam semalam berdasarkan penentuan keamanan nasional sepihak.
Independensi vs. pengawasan de facto. Anthropic didirikan dengan misi yang menekankan keamanan dan independensi. Tindakan Gedung Putih menunjukkan bahwa bahkan lab yang paling "bertanggung jawab" pun bisa dipaksa mematuhi standar pemerintah yang secara teknis tidak realistis—atau produknya langsung dimatikan . Seperti yang dikatakan Bloomberg, blokade ini menandai "pembalikan kebijakan AS" dan "peringatan bagi Silicon Valley" bahwa era penerapan AI frontier yang diatur sendiri mungkin sudah berakhir
.
Comments
0 comments