Kedua model ini tidak tersedia untuk masyarakat umum pada saat pengumuman Cisco. Anthropic menilai Claude Mythos Preview terlalu berbahaya untuk dirilis secara bebas, khususnya karena kemampuan ofensif sibernya. Alhasil, model ini hanya disediakan untuk konsorsium mitra industri pilihan di bawah pengawasan ketat . Pendekatan OpenAI dengan Daybreak sedikit lebih luas—menawarkan akses berjenjang, termasuk tingkat "GPT-5.5-Cyber" khusus untuk keperluan tim ofensif (red-team)—tetapi kemampuan paling kuat tetap dibatasi untuk organisasi yang telah diperiksa seperti Cisco, CrowdStrike, dan lembaga pemerintah
.
Mesin internal Cisco untuk menjalankan model ini, yang disebut Cisco Foundry Security Spec, diuji di enam model AI frontier untuk memastikannya bisa bekerja secara independen terhadap model apa pun. Dalam kata-kata Cisco sendiri, "Model adalah akseleratornya; mesinnya adalah rangka kerja ini."
Cisco adalah anggota pendiri dari dua upaya industri besar yang mempersenjatai AI frontier untuk pertahanan siber.
Project Glasswing dari Anthropic: Diluncurkan pada April 2026, Project Glasswing memberikan akses ke Claude Mythos Preview kepada sekelompok mitra yang dipilih secara hati-hati dengan syarat-syarat ketat. Tujuannya adalah untuk menemukan dan menambal kerentanan di perangkat lunak kritis sebelum penyerang dapat mengeksploitasinya. Peserta piagam meliputi AWS, Apple, Google, Microsoft, Nvidia, CrowdStrike, Linux Foundation, dan Cisco . Inisiatif ini beroperasi melalui kerangka pengungkapan terkoordinasi, di mana kerentanan yang diidentifikasi dilaporkan secara bertanggung jawab kepada pengelola perangkat lunak
.
Daybreak dari OpenAI: Diumumkan pada 11 Mei 2026, Daybreak adalah jawaban institusional langsung OpenAI terhadap Project Glasswing. Dibangun di atas GPT-5.5 dan Codex Security, ia menggabungkan tiga tingkat model di balik kerangka agen yang disetel untuk keamanan, dirancang untuk mengotomatiskan peninjauan kode dan validasi patch dalam skala besar. Cisco bergabung sebagai mitra ekosistem piagam bersama Cloudflare, CrowdStrike, dan Palo Alto Networks .
Kedua inisiatif ini merepresentasikan perpecahan filosofis mendasar dalam industri AI. Anthropic berargumen bahwa mengontrol akses ke model paling berbahaya adalah cara terbaik untuk meningkatkan keamanan siber global, sementara OpenAI mendorong akses yang lebih luas dan berjenjang—termasuk untuk lembaga pemerintah di semua tingkatan—untuk membanjiri arena dengan para pembela berbantuan AI .
Motivasi Cisco dinyatakan sederhana: serangan bertenaga AI bukan lagi teoretis, dan para pembela tidak bisa bergerak dengan kecepatan manusia. Saat Anthropic mengumumkan penahanan Claude Mythos Preview, mereka secara bersamaan mengungkapkan bahwa model itu telah mengidentifikasi kelemahan di infrastruktur perangkat lunak kritis yang mendasari internet dan ekonomi yang lebih luas . Implikasinya jelas: jika tim defensif tidak menggunakan model ini lebih dulu, para penjahat siber pada akhirnya akan mendapatkan akses ke kemampuan yang setara.
Cisco membingkai pemindaian 1,8 miliar baris kode sebagai perlombaan melawan keniscayaan itu. Perusahaan mencatat bahwa model frontier "menemukan kerentanan pada skala yang belum pernah dicapai sebelumnya, dan ini bukan sekali jadi. Hal-hal ini akan terus menemukan kerentanan baru" . Dengan menjalankan pemindaian di seluruh portofolionya, Cisco bertujuan untuk mendahului penyerang yang mungkin menggunakan model serupa untuk mengidentifikasi kelemahan yang sama—tetapi dengan niat jahat.
Di tengah keriuhan tentang kecepatan dan skala, Cisco secara sistematis menghindari pertanyaan paling penting: berapa banyak kerentanan yang benar-benar ditemukan oleh model tersebut? Berbagai laporan mengonfirmasi bahwa Cisco "menolak untuk mengungkapkan jumlah total kerentanan" yang ditemukan, tanpa memberikan hitungan, rincian tingkat keparahan, atau jumlah temuan kritis dan yang dapat dieksploitasi .
Keheningan ini menciptakan masalah kredibilitas yang jelas. Jika model menemukan ribuan celah serius, mengungkapkan angka itu akan memvalidasi seluruh latihan—tetapi juga bisa mencemaskan pelanggan dan regulator. Jika mereka hanya menemukan sedikit, maka kerangka "delapan pekan versus delapan tahun" akan runtuh. Apa pun pilihannya, Cisco memutuskan untuk merahasiakan jumlahnya sambil memuji "kekuatan transformatif" dari upaya pemindaian AI tersebut .
Satu perubahan konkret dan dapat ditindaklanjuti memang muncul di Cisco Live 2026: mulai Juli, Cisco meninggalkan model pengungkapan kerentanan ad-hoc sebelumnya dan beralih ke pendekatan yang terprediksi dan terjadwal. Perusahaan sekarang akan menerbitkan penasihat keamanan pada Rabu pertama dan ketiga setiap bulannya, disertai dengan pemberitahuan awal tujuh hari yang mencantumkan teknologi dan platform mana yang akan dibahas dalam setiap rilis .
Alasannya terkait langsung dengan program pemindaian AI. Tim Respons Insiden Keamanan Produk (PSIRT) Cisco memperkirakan penemuan kerentanan yang dipercepat AI akan secara dramatis meningkatkan volume temuan, dan irama dua kali sebulan dirancang untuk memberi pelanggan korporat prediktabilitas yang mereka butuhkan untuk merencanakan siklus penambalan, alih-alih berebut menanggapi penasihat kejutan . Jika tidak ada publikasi keamanan yang direncanakan untuk jendela rilis tertentu, Cisco akan mengomunikasikannya juga
.
Sementara Cisco memindai basis kodenya sendiri, Institut Keamanan AI Inggris (AISI) secara independen mengevaluasi dua model yang digunakan Cisco—dan temuannya sangat serius. Dalam serangkaian evaluasi yang diterbitkan antara April dan Juni 2026, AISI menemukan :
Claude Mythos Preview "secara substansial lebih mumpuni dalam serangan siber daripada model mana pun yang pernah kami nilai sebelumnya." Pemerintah Inggris mengutip temuan ini secara langsung dalam surat terbuka April 2026 dari Menteri Liz Kendall dan Menteri Keamanan Dan Jarvis kepada semua pemimpin bisnis Inggris, mendesak dewan direksi untuk memperlakukan risiko siber yang ditingkatkan AI sebagai tanggung jawab tata kelola tingkat pertama . Mythos Preview mencapai tingkat keberhasilan 73% pada tugas capture-the-flag (CTF) tingkat ahli—yang pertama untuk model apa pun yang pernah dievaluasi institut ini
.
GPT-5.5 menyelesaikan simulasi serangan jaringan korporat 32 langkah milik AISI dari awal hingga akhir, sebuah tolok ukur yang diperkirakan institut itu akan memakan waktu sekitar 20 jam bagi seorang ahli manusia. Model ini juga memenuhi banyak dari rangkaian 95 tugas CTF siber sempit milik AISI, menjadikan tolok ukur dasar tidak cukup untuk mengukur risiko siber model frontier secara berarti . Pada tugas lanjutan tingkat ahli, GPT-5.5 mencapai tingkat kelulusan rata-rata sekitar 71%, dibandingkan dengan sekitar 69% untuk Mythos Preview dan sekitar 52% untuk GPT-5.4 generasi sebelumnya
.
Tren keseluruhan semakin cepat: AISI menemukan bahwa kemampuan model AI frontier untuk menyelesaikan tugas siber secara otonom sekarang berlipat ganda setiap 4,7 bulan, turun tajam dari interval penggandaan 8 bulan yang dicatat institut ini pada November 2025. Baik Claude Mythos Preview maupun GPT-5.5 secara substansial melampaui garis tren yang sudah menanjak ini .
Implikasi dari tingkat penggandaan 4,7 bulan sangat nyata. Jika tren ini bertahan, dalam waktu sekitar satu setengah tahun, sistem AI dapat secara otonom menyelesaikan tugas siber yang saat ini memerlukan tim operator ahli manusia yang bekerja selama berminggu-minggu atau berbulan-bulan. AISI mencatat bahwa pos pemeriksaan (checkpoint) yang lebih baru dari kedua model telah memenuhi rangkaian evaluasi 95 tugas yang ada, menghasilkan "cakrawala waktu yang sangat tidak pasti" karena tolok ukur tidak bisa lagi mengukur sejauh mana kemampuan model yang sebenarnya .
Pengumuman Cisco, jika digabungkan dengan evaluasi AISI, melukiskan gambaran industri yang telah menerima—dan secara aktif berpartisipasi dalam—perlombaan senjata defensif berbahan bakar AI. Model frontier yang sama yang dapat memindai 1,8 miliar baris kode untuk mencari kerentanan, secara teori, dapat digunakan oleh penyerang untuk menemukan dan mengeksploitasi kerentanan yang sama lebih cepat daripada tim merah manusia mana pun.
Logika dari Project Glasswing dan Daybreak adalah bahwa pertahanan terbaik adalah memberikan model yang paling mumpuni kepada organisasi yang paling bertanggung jawab terlebih dahulu, di bawah kontrol ketat, sehingga mereka dapat menambal infrastruktur kritis sebelum kemampuan ofensifnya menyebar. Pemindaian 1,8 miliar baris kode oleh Cisco adalah uji coba dunia nyata terbesar dari tesis itu hingga saat ini. Namun, keputusan perusahaan untuk menahan jumlah celah yang sebenarnya meninggalkan sisa industri dengan bukti konsep yang menggiurkan tetapi tidak lengkap—dan irama pengungkapan berbasis AI yang baru yang menunjukkan bahwa volume temuan cukup signifikan untuk memerlukan perubahan operasional permanen.
Comments
0 comments