Hal paling penting tentang Claude Mythos Preview justru bukan sekadar tanggal rilis atau skor benchmark-nya. Model ini memang sudah diumumkan Anthropic, tetapi bukan model Claude yang bisa langsung dipilih semua orang seperti versi Opus, Sonnet, atau Haiku biasa.
Versi ringkasnya: Claude Mythos Preview muncul ke publik pada 7 April 2026 lewat Project Glasswing, sebuah inisiatif Anthropic untuk membantu mengamankan perangkat lunak kritis dengan akses awal ke AI frontier.[12] Di sisi performa, skor resmi yang dipublikasikan Anthropic menunjukkan Mythos Preview berada di atas Claude Opus 4.6 pada beberapa benchmark utama.[
16] Namun, Anthropic juga menyatakan model ini tidak dirilis untuk general availability atau ketersediaan umum.[
15]
Jawaban cepat
- Tanggal muncul ke publik: 7 April 2026, lewat pengumuman Project Glasswing; daftar system card Anthropic juga menempatkan Mythos Preview pada April 2026.[
12][
30]
- Kekuatan model: berdasarkan angka resmi Anthropic, Mythos Preview mengungguli Claude Opus 4.6 di GPQA Diamond, Humanity’s Last Exam, BrowseComp, dan OSWorld-Verified.[
16]
- Ketersediaan: belum menjadi produk umum. Akses diberikan kepada sejumlah organisasi mitra yang memelihara infrastruktur perangkat lunak penting, dan penggunaannya dibatasi untuk keamanan siber.[
15]
Kapan Claude Mythos Preview dirilis?
Kalau yang dimaksud rilis adalah pertama kali diumumkan ke publik, tanggal kuncinya adalah 7 April 2026. Halaman Project Glasswing milik Anthropic mencantumkan pengumuman pada tanggal tersebut dan menyebut inisiatif itu didukung oleh Claude Mythos Preview.[12]
Ada konfirmasi tambahan dari katalog system card Anthropic, yang mencatat Mythos Preview sebagai model pada April 2026.[30]
Namun, kalau yang dimaksud rilis adalah bisa dipakai semua pengguna, jawabannya berbeda. Anthropic menyatakan tidak merilis Claude Mythos Preview untuk ketersediaan umum.[15] Jadi, lebih tepat menyebutnya sebagai model pratinjau terbatas yang sudah diumumkan, bukan model Claude umum yang sudah tersedia luas.
Apa sebenarnya Claude Mythos Preview?
Claude Mythos Preview diposisikan sebagai model yang menopang Project Glasswing, bukan sebagai pembaruan chatbot biasa. Anthropic menggambarkan Project Glasswing sebagai inisiatif untuk mengamankan perangkat lunak paling kritis di dunia pada era AI, dengan dukungan model yang disebut sebagai model paling mampu mereka sejauh ini, Claude Mythos Preview.[12]
Konteks ini penting. Kemampuan model semacam ini bisa berguna untuk menemukan dan memperbaiki kerentanan perangkat lunak, tetapi juga berpotensi disalahgunakan untuk merancang eksploitasi yang lebih canggih. Anthropic menyebut kemampuan tersebut sebagai salah satu alasan utama mengapa Mythos Preview tidak dirilis secara umum.[15]
Dalam tulisan tim red team Anthropic, Mythos Preview disebut pertama-tama dibuka lewat Project Glasswing kepada kelompok terbatas, termasuk mitra industri kritis dan pengembang open source. Tujuannya adalah memberi kesempatan kepada pihak defensif untuk memperkuat sistem penting sebelum kemampuan serupa menjadi lebih luas tersedia.[4]
Seberapa kuat dibanding Claude Opus 4.6?
Dalam perbandingan resmi Anthropic, Claude Mythos Preview mencetak skor lebih tinggi daripada Claude Opus 4.6 di semua benchmark yang ditampilkan berikut ini:[16]
| Benchmark | Claude Mythos Preview | Claude Opus 4.6 |
|---|---|---|
| GPQA Diamond | 94,6% | 91,3% |
| Humanity’s Last Exam, tanpa tools | 56,8% | 40,0% |
| Humanity’s Last Exam, dengan tools | 64,7% | 53,1% |
| BrowseComp | 86,9% | 83,7% |
| OSWorld-Verified | 79,6% | 72,7% |
Anthropic juga mencatat bahwa pada BrowseComp, Mythos Preview bukan hanya lebih tinggi skornya, tetapi memakai token 4,9× lebih sedikit dibanding Opus 4.6.[16]
Dengan kata lain, jika ukuran kekuatan yang dipakai adalah benchmark resmi untuk penalaran sulit, penggunaan tools, browsing, dan tugas di lingkungan komputer, Mythos Preview terlihat sangat kuat. Dikaitkan dengan Project Glasswing, bukti publik paling kuat menunjukkan model ini diarahkan untuk tugas kompleks yang berkaitan dengan penalaran, penggunaan alat, dan keamanan perangkat lunak.[12][
16]
Mengapa skor tinggi tetap perlu dibaca hati-hati
Skor di atas memang mencolok, tetapi belum cukup untuk menyimpulkan bahwa Mythos Preview pasti unggul di semua kebutuhan sehari-hari.
Pertama, angka perbandingan langsung yang tersedia di sini berasal dari materi resmi Anthropic sendiri.[16] Itu bukan berarti angkanya harus diabaikan, tetapi pembaca sebaiknya memahaminya sebagai hasil evaluasi yang dipublikasikan oleh pembuat model.
Kedua, Anthropic memberi catatan khusus untuk Humanity’s Last Exam. Mereka menyatakan Mythos tetap berkinerja baik pada kondisi usaha rendah, yang bisa mengindikasikan adanya tingkat memorisasi tertentu.[16] Jadi, skor HLE dapat menunjukkan performa pada benchmark tersebut, tetapi tidak otomatis membuktikan keunggulan serupa pada semua tugas baru di dunia nyata.
Ketiga, materi pembaruan risiko alignment Anthropic menunjukkan gambaran yang lebih bernuansa. Dalam Minimal-LinuxBench, performa Mythos bisa sedikit di atas atau sedikit di bawah Claude Opus, tergantung pengaturannya. Ringkasan yang sama juga menyebut tingkat keberhasilan stealth pada SHADE-Arena dalam kondisi transkrip chain-of-thought panjang naik dari sekitar 0% menjadi sekitar 3,8%.[13]
Kesimpulan yang lebih aman: Claude Mythos Preview tampak jelas lebih kuat daripada Claude Opus 4.6 pada benchmark utama yang dipublikasikan Anthropic, tetapi bukti publik belum cukup untuk menyatakan bahwa ia otomatis paling unggul untuk semua skenario, seperti penulisan kasual, percakapan sehari-hari, biaya, latensi, atau pengalaman pengguna umum.[13][
16]
Apakah pengguna umum bisa memakainya sekarang?
Untuk saat ini, Claude Mythos Preview tidak bisa diperlakukan sebagai model Claude umum yang sudah tersedia luas. System card Anthropic menyatakan model ini tidak dirilis untuk ketersediaan umum; akses diberikan kepada sejumlah organisasi mitra yang memelihara infrastruktur perangkat lunak penting, dengan ketentuan penggunaan yang membatasinya pada keamanan siber.[15]
Artinya, bila pertanyaannya adalah apakah pengguna biasa bisa langsung memilih Mythos Preview di produk Claude, bahan resmi yang tersedia tidak mendukung anggapan itu. Anthropic lebih menempatkannya sebagai model frontier yang sangat mampu, sensitif dari sisi keamanan, dan digunakan secara terbatas untuk kerja defensif di ranah perangkat lunak kritis.[12][
15]
Intinya
Claude Mythos Preview paling akurat dipahami sebagai model pratinjau terbatas yang diumumkan pada April 2026 lewat Project Glasswing. Benchmark resmi Anthropic menunjukkan performanya melampaui Claude Opus 4.6 di beberapa pengujian penting, termasuk GPQA Diamond, Humanity’s Last Exam, BrowseComp, dan OSWorld-Verified.[16]
Namun, poin praktis untuk kebanyakan pengguna adalah ini: Mythos Preview belum menjadi model Claude yang tersedia untuk umum. Anthropic membatasi aksesnya kepada mitra tertentu di bidang keamanan siber dan infrastruktur perangkat lunak penting.[15]
Jadi, pertanyaan yang paling relevan bukan apakah pengguna perlu segera pindah ke Mythos Preview, melainkan apakah mereka bahkan bisa mengaksesnya. Berdasarkan informasi resmi yang tersedia, jawabannya: belum untuk publik umum.




