Beberapa peningkatan sangat menonjol. Dari sisi kapabilitas, Opus 4.8 memberikan hasil yang lebih baik pada pengodean otonom, pekerjaan pengetahuan multidisiplin, dan penggunaan komputer berbasis agen . Sebuah fitur Dynamic Workflows baru di Claude Code memungkinkan model untuk mengorkestrasi ratusan sub-agen paralel untuk migrasi skala codebase yang mencakup ratusan ribu baris kode
. Pengguna juga mendapatkan tingkat usaha (effort levels) yang dapat dikonfigurasi—high, xhigh, dan max—serta mode cepat yang beroperasi pada kecepatan 2,5× lipat dengan biaya tiga kali lebih murah dari mode cepat sebelumnya
.
Keandalan menerima peningkatan besar. Opus 4.8 telah dilatih untuk menandai ketidakpastian dalam pekerjaannya sendiri secara lebih efektif. Model ini kira-kira empat kali lebih kecil kemungkinannya dibanding pendahulunya untuk membiarkan cacat dalam kodenya sendiri tanpa menandainya, mengatasi frustrasi umum di mana model canggih dengan percaya diri mengirimkan hasil yang rusak . Anthropic menggambarkan ini sebagai terobosan dalam kejujuran model untuk rekayasa perangkat lunak
.
Yang krusial, meskipun Opus 4.8 adalah agen otonom yang lebih kuat, ia dibangun di atas standar penerapan dan keamanan ASL-3 (AI Safety Level 3) yang sama dengan anggota keluarga Claude Opus 4 lainnya. Protokol ini mencakup pengamanan ketat yang secara otomatis memblokir permintaan yang mengindikasikan penggunaan keamanan siber yang dilarang atau berisiko tinggi, serta kontrol keamanan yang kuat untuk melindungi bobot model dari pencurian oleh aktor non-negara yang canggih .
Kisah Claude Mythos Preview-lah yang benar-benar membedakan hari peluncuran ini dari pembaruan model rutin. Pada April 2026, Anthropic mengungkapkan keberadaan model ini tetapi secara eksplisit menolak untuk merilisnya ke publik. Masalah intinya: Mythos Preview menunjukkan penemuan dan eksploitasi otonom atas kerentanan zero-day di setiap sistem operasi utama dan peramban web . Institut Keamanan AI Inggris (AISI) mengkonfirmasi bahwa Mythos Preview memecahkan 73% tantangan keamanan siber capture-the-flag (CTF) tingkat ahli—sebuah hasil mengejutkan yang meninggalkan model-model sebelumnya jauh di belakang
.
Untuk memitigasi risiko yang jelas, Anthropic menciptakan Project Glasswing, sebuah inisiatif terkontrol dengan sekitar 50 organisasi mitra—termasuk AWS, Apple, Google, Microsoft, CrowdStrike, dan JPMorgan Chase—yang menggunakan Mythos Preview secara eksklusif untuk penemuan kerentanan defensif . Hasilnya bersejarah. Para mitra menemukan lebih dari 10.000 kerentanan tingkat tinggi atau kritis di seluruh perangkat lunak paling penting secara sistemik di dunia, dengan sebagian besar organisasi menemukan ratusan cacat semacam itu masing-masing dalam bulan pertama akses mereka
. Dari temuan tersebut, 6.202 diklasifikasikan sebagai kerentanan zero-day baru yang sebelumnya tidak diketahui
. Penemuan ini menjangkau infrastruktur kritis dan mencakup cacat yang tertanam dalam, seperti kerentanan berusia 27 tahun di OpenBSD, salah satu sistem operasi paling tangguh dari sisi keamanan yang tersedia
.
Pada 28 Mei, Anthropic mendeklarasikan eksperimen ini sukses dan mengumumkan pihaknya sedang bersiap untuk merilis model kelas Mythos sebagai "model kelas baru" untuk semua pelanggan dalam beberapa minggu mendatang . Hasil Glasswing memberikan bukti bahwa dengan pagar pembatas yang tepat, model-model ini dapat ditangani dengan aman untuk pekerjaan siber defensif. Analis industri melaporkan bahwa Claude Mythos 1 diharapkan hadir pada Juni 2026, diluncurkan bersamaan dengan model utama lainnya seperti Gemini 3.5 Pro dan Grok 5
.
Rilis produk ini datang dengan kejutan finansial. Pada hari yang sama, Anthropic mengumumkan telah menutup pendanaan Seri H senilai $65 miliar pada valuasi pasca-pendanaan sebesar $965 miliar, lebih dari dua kali lipat valuasi sebelumnya sebesar $380 miliar pada Februari . Putaran pendanaan ini dipimpin oleh Altimeter Capital, Dragoneer, Greenoaks, dan Sequoia Capital, dengan komitmen signifikan dari Blackstone, D.E. Shaw, DST Global, dan Fidelity
.
Modal ini secara resmi menjadikan Anthropic sebagai startup AI paling bernilai di dunia, melampaui valuasi terakhir OpenAI yang dikonfirmasi sebesar $852 miliar . Anthropic menyatakan dana tersebut akan disalurkan untuk memperluas kapasitas komputasi guna memenuhi permintaan perusahaan yang terus meningkat untuk Claude dan untuk menskalakan produk secara global
.
Keputusan untuk mendorong Mythos ke rilis luas bukannya tanpa penentang yang vokal. Inti dari perdebatan ini adalah dilema "penggunaan ganda" (dual-use): kekuatan penalaran yang sama yang membuat Mythos luar biasa dalam menemukan kerentanan untuk ditambal juga menjadikannya alat ofensif pamungkas . Para analis memperingatkan bahwa akses luas dapat mempersenjatai aktor jahat dengan alat yang secara otonom dapat merangkai beberapa eksploitasi untuk melewati perlindungan kotak pasir (sandbox) sistem operasi dan perlindungan perender peramban
.
Bug bounty tradisional dan model peretasan etis kini menghadapi pertanyaan eksistensial. Jika satu model dapat secara mandiri mengungkap ribuan zero-day, peran peneliti keamanan manusia bergeser dari penemuan ke triase dan penahanan . Strategi penahanan Anthropic—menggunakan Project Glasswing untuk menyaring akses ke 50 perusahaan yang telah diperiksa—telah menuai pujian sekaligus kritik. Para pendukung berpendapat hal itu mencegah kebocoran katastropik sambil membuktikan nilai defensif model; para kritikus berpendapat bahwa menjauhkan alat semacam itu dari komunitas keamanan yang lebih luas memperlambat proses penambalan global
.
Pengumuman 28 Mei menandai akhir dari sebuah eksperimen dan awal dari fase baru. Anthropic bertaruh bahwa manfaat defensif dari model kelas Mythos yang tersedia secara luas lebih besar daripada risiko ofensifnya, sebuah taruhan yang akan segera diuji begitu model ini dikirimkan.
Comments
0 comments