Perdebatan soal Claude Mythos Preview sebaiknya dimulai dari pertanyaan yang tepat: bukan apakah nama itu benar ada, melainkan sejauh mana kemampuan keamanan sibernya sudah terbukti. Dalam system card Anthropic, Claude Mythos Preview disebut sebagai model bahasa besar baru dan frontier AI model dengan kemampuan di software engineering, penalaran, dan keamanan siber.[16] Evaluasi AI Security Institute (AISI) Inggris juga melaporkan peningkatan pada tantangan CTF dan simulasi serangan siber multi-langkah.[
25]
Namun, menyebutnya sebagai “superhacker otomatis” yang sudah sepenuhnya dibuktikan secara independen masih terlalu tegas. Klaim paling besar—terutama soal “ribuan” zero-day berisiko tinggi—masih terutama berasal dari Anthropic dan pemberitaan yang mengutipnya, sementara laporan luar masih mempertanyakan seberapa realistis, dapat dieksploitasi, dan parah celah-celah itu.[1][
26][
27]
Jawaban singkat: penting, tetapi jangan dimitoskan
Claude Mythos Preview layak dipandang sebagai pratinjau kemampuan keamanan siber AI yang bernilai tinggi sekaligus berisiko tinggi, bukan sekadar fitur chat Claude untuk pengguna umum. Bahan publik mendukung tiga kesimpulan yang relatif aman: ini adalah model frontier yang diumumkan Anthropic; kemampuan pada tugas keamanan siber terukur meningkat; dan model ini tidak dibuka luas sebagai produk publik biasa.[16][
25][
26][
32]
Yang belum cukup kuat adalah klaim bahwa model ini sudah secara stabil, di dunia nyata, dan dapat diaudit publik menemukan serta mengeksploitasi ribuan zero-day berisiko tinggi.[27] Formulasi yang lebih hati-hati: Mythos Preview tampaknya menandai lompatan penting dalam otomatisasi pencarian kerentanan, tetapi klaim paling spektakulernya masih membutuhkan lebih banyak contoh terbuka, standar klasifikasi, dan verifikasi pihak ketiga.[
25][
27]
Apa sebenarnya Claude Mythos Preview?
Menurut system card Anthropic, Claude Mythos Preview adalah model bahasa besar baru dari Anthropic sekaligus frontier AI model, dengan kemampuan di bidang rekayasa perangkat lunak, penalaran, dan keamanan siber.[16] Jadi, ini bukan nama prompt role, plugin pihak ketiga, atau template proyek Claude; ini adalah model yang dijelaskan dalam dokumen publik Anthropic.[
16]
Perhatian industri keamanan muncul karena keamanan siber disebut sebagai salah satu area kemampuan utamanya.[16] Karena itu, pertanyaan kuncinya bukan lagi “model ini ada atau tidak”, melainkan bagaimana kemampuan itu diuji, siapa yang boleh mengaksesnya, dan bagaimana hasil temuan celah keamanan harus dilaporkan serta diperbaiki. Sejumlah laporan menyebut Anthropic memilih membatasi rilisnya, bukan membukanya sebagai model publik untuk semua orang.[
26][
32]
Benarkah bisa menemukan zero-day otomatis?
Jawabannya perlu dipisahkan antara klaim perusahaan dan bukti eksternal. New York Times melaporkan bahwa eksekutif Anthropic menyebut Claude Mythos Preview sudah mampu melakukan riset keamanan secara otonom, termasuk memindai dan mengeksploitasi zero-day pada perangkat lunak penting; zero-day berarti celah yang bahkan belum diketahui oleh pengembang perangkat lunaknya.[1]
The Hacker News juga mengutip klaim Anthropic bahwa Mythos Preview telah menemukan ribuan zero-day berisiko tinggi di sistem operasi besar dan peramban web utama.[26] Ini klaim yang perlu diperhatikan, tetapi tidak otomatis berarti semua temuan tersebut sudah dipublikasikan, diperiksa satu per satu, dan diverifikasi pihak ketiga.
Tom’s Hardware mempertanyakan klaim “ribuan” celah berisiko tinggi itu, antara lain karena informasi publik belum menjelaskan seberapa realistis celah tersebut, berapa banyak yang sebenarnya tidak dapat dieksploitasi, dan seberapa serius dampaknya.[27] Maka kesimpulan paling akurat saat ini: bukti publik mendukung adanya kemajuan nyata pada tugas terkait penemuan kerentanan, tetapi angka “ribuan zero-day berisiko tinggi” masih merupakan klaim kuat yang belum sepenuhnya terbuka untuk diaudit publik.[
25][
27]
Apa yang dibuktikan evaluasi AISI?
Pada 13 April 2026, AI Security Institute (AISI) Inggris menerbitkan evaluasi kemampuan siber Claude Mythos Preview, model yang diumumkan Anthropic pada 7 April.[25] AISI melaporkan peningkatan berkelanjutan dalam tantangan CTF atau capture-the-flag—latihan keamanan siber dalam lingkungan terkontrol—serta peningkatan signifikan dalam simulasi serangan siber multi-langkah.[
25]
Ini adalah salah satu bukti eksternal paling penting, karena tidak sekadar mengulang materi promosi Anthropic. Namun ruang lingkupnya tetap perlu dibaca apa adanya. CTF dan simulasi multi-langkah menunjukkan model lebih kuat dalam tugas keamanan siber yang dikendalikan, tetapi tidak membuktikan bahwa setiap celah dunia nyata yang diklaim benar-benar ada, berbahaya, dapat dieksploitasi, atau sudah selesai diverifikasi secara publik.[25][
27]
Mengapa tidak dibuka untuk publik?
Alasan yang muncul dalam laporan publik cukup konsisten: kemampuan semacam ini berpotensi disalahgunakan. The Hacker News melaporkan bahwa, karena kemampuan keamanan siber Mythos Preview dan risiko penyalahgunaannya, Anthropic memilih tidak membuat model ini tersedia secara umum.[26] NBC News juga melaporkan bahwa Anthropic menahan Mythos Preview dari rilis publik dan hanya membagikannya kepada kelompok terbatas berisi raksasa teknologi dan mitra untuk membantu memperkuat pertahanan.[
32]
Dengan kata lain, kontroversinya bukan hanya “seberapa pintar model ini”, tetapi juga siapa yang boleh mengakses, bagaimana akses diaudit, bagaimana keluaran diverifikasi, bagaimana kerentanan dilaporkan, dan apakah pihak penyerang dapat meniru kemampuan serupa.[26][
32]
Di mana posisi Project Glasswing?
WIRED melaporkan bahwa Project Glasswing mempertemukan Apple, Google, dan lebih dari 45 organisasi untuk menggunakan Claude Mythos Preview dalam menguji kemampuan keamanan siber AI yang terus meningkat.[30] Dari laporan publik, inisiatif ini lebih mirip kerja sama terbatas dan pengujian defensif daripada peluncuran produk massal.[
30][
32]
Logikanya jelas: jika model memang dapat menemukan celah pada perangkat lunak penting lebih cepat, organisasi yang memelihara perangkat lunak tersebut sebaiknya ikut lebih dulu dalam pengujian dan perbaikan.[30][
32] Meski begitu, laporan yang tersedia belum membuka secara lengkap syarat akses, aturan audit, alur pengungkapan kerentanan, atau mekanisme penanganan penyalahgunaan. Jadi Project Glasswing belum bisa dianggap sebagai jawaban final atas semua masalah tata kelola.[
30][
32]
Kekuatan sebenarnya: bukan cuma model, tetapi orkestrasi agen
Salah satu detail penting ada dalam penjelasan metode di red.anthropic.com. Untuk memperbanyak variasi bug yang ditemukan dan menjalankan banyak salinan Claude secara paralel, Anthropic meminta setiap agen fokus pada file berbeda dalam sebuah proyek; untuk efisiensi, Claude lebih dulu diminta memberi peringkat 1 sampai 5 pada setiap file berdasarkan kemungkinan file tersebut mengandung bug yang “menarik”.[8]
Artinya, kemampuan yang ditampilkan kemungkinan bukan hasil satu sesi tanya jawab biasa. Yang bekerja adalah sistem: memilah file yang lebih berisiko, membagi pekerjaan ke banyak agen, lalu meninjau area berbeda secara paralel agar temuan tidak berulang dan cakupannya lebih luas.[8] Bagi dunia keamanan, ini penting karena risiko masa depan mungkin datang dari kombinasi model dasar, orkestrasi agen, dan strategi pencarian paralel—bukan hanya dari jawaban sebuah chatbot di kotak percakapan.[
8]
Apa yang sudah cukup pasti?
- Model ini nyata dalam materi Anthropic. Claude Mythos Preview dijelaskan dalam system card sebagai model bahasa besar baru dan frontier AI model, dengan kemampuan di rekayasa perangkat lunak, penalaran, dan keamanan siber.[
16]
- Kemampuan sibernya meningkat dalam evaluasi tertentu. AISI melaporkan perbaikan pada tantangan CTF dan simulasi serangan siber multi-langkah.[
25]
- Aksesnya tidak dibuka luas. Laporan publik menyebut Anthropic memilih rilis terbatas lewat mitra dan kerja sama pengujian, bukan model publik biasa.[
26][
30][
32]
- Proses penemuan celahnya memakai orkestrasi. Materi Anthropic menunjukkan penggunaan banyak salinan Claude secara paralel, pembagian fokus antaragen, dan pemeringkatan file sebelum pemeriksaan.[
8]
Di mana kita masih harus hati-hati?
- “Ribuan celah” tidak otomatis berarti “ribuan zero-day kritis yang pasti bisa dieksploitasi”. Tom’s Hardware secara eksplisit mempertanyakan realisme, kemampuan eksploitasi, dan tingkat keparahan celah yang diklaim.[
27]
- Belum tepat menyimpulkan Mythos Preview sudah mengungguli peneliti keamanan terbaik dalam semua situasi dunia nyata. AISI mendukung kesimpulan peningkatan pada tugas evaluasi tertentu, bukan vonis menyeluruh untuk seluruh riset keamanan.[
25]
- Jangan menganggap semuanya berasal dari model dasar saja. Alur paralel dengan banyak agen dan pemeringkatan file menunjukkan orkestrasi sistem dapat menjadi bagian penting dari hasilnya.[
8]
- Rilis terbatas belum sama dengan risiko hilang. Laporan publik hanya menunjukkan Anthropic membatasi akses dan memakai skema seperti Project Glasswing; detail tata kelola lengkapnya belum terbuka.[
30][
32]
Apa artinya bagi pengguna dan tim keamanan?
Bagi pengguna biasa, kesimpulan paling praktis sederhana: Claude Mythos Preview bukan produk Claude yang bisa dibuka seperti chatbot umum. Laporan publik menunjukkan Anthropic memilih berbagi secara terbatas, bukan merilisnya untuk semua orang.[26][
32]
Bagi tim keamanan, sinyalnya lebih serius. Dalam evaluasi dan penjelasan metode yang tersedia, AI sudah menyentuh wilayah pencarian kerentanan otomatis, peninjauan paralel, dan simulasi serangan multi-langkah.[8][
25] Ini tidak berarti semua pekerjaan peneliti keamanan akan langsung digantikan model, tetapi organisasi perlu lebih serius menilai penggunaan AI untuk pencarian celah, proses pengungkapan kerentanan, dan kecepatan respons patch.[
25][
32]
Kesimpulan akhirnya: Claude Mythos Preview kemungkinan merupakan titik penting dalam otomatisasi keamanan siber berbasis AI. Namun bukti publik saat ini lebih kuat untuk menyatakan “kemampuannya meningkat signifikan” daripada “semua klaim zero-day paling dramatis sudah terbukti secara independen”.[16][
25][
27]




