JawabanDipublikasikan3 hari yang laluLast edited 3 hari yang lalu32 sumber

Mengapa Pakar Keamanan Siber Menyebut Claude Fable 5 Milik Anthropic 'Terlalu Aman' untuk Digunakan

Peneliti keamanan siber mengecam Claude Fable 5 karena pagar pembatas keamanannya secara agresif memblokir kueri keamanan yang tidak berbahaya sekalipun, dan secara diam diam mengalihkannya ke model yang lebih lemah t... Reaksi keras berpusat pada mekanisme yang mengalihkan permintaan tentang keamanan siber, biologi...

Cari dan periksa fakta dengan Studio Global AI Jelajahi lebih banyak halaman Trending

27K0

A conceptual illustration of a locked digital shield representing AI safety guardrails, with glowing data streams being filtered and diverted, set against a dark cybersecurity-them — What is causing cybersecurity professionals to criticize Anthropic's Claude Fable 5, and how does the model's safety guardrail system work,Anthropic's Claude Fable 5 uses aggressive, silent guardrails to keep its most powerful capabilities out of public hands, a move that has sparked intense debate in the cybersecurity community.
AI Perintah
Create a landscape editorial hero image for this Studio Global article: What is causing cybersecurity professionals to criticize Anthropic's Claude Fable 5, and how does the model's safety guardrail system work,. Article summary: Anthropic released Claude Fable 5 on June 9, 2026 as a guardrailed public version of its powerful Mythos-class model, alongside an unrestricted twin, Claude Mythos 5, available only to vetted partners through Project Gla. Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Claude Fable 5: Why Anthropic Put Its Most Powerful AI Behind Guardrails. * Anthropic released Claude Fable 5 on 9 June 2026. It is the first publicly available Mythos-class mode" source context "Claude Fable 5: Anthropic Locks Down Cyber and Bio" Reference image 2: visual subject "# Anthropic says these topics
openai.com

Anthropic merilis Claude Fable 5 pada 9 Juni 2026, sebagai model AI paling canggih mereka yang tersedia untuk publik, namun peluncuran ini langsung disambut gelombang protes dari komunitas keamanan siber. Sementara perusahaan menyebutnya sebagai perilisannya yang bertanggung jawab atas teknologi kelas Mythos, para profesional keamanan berpendapat bahwa pagar pembatas keamanan bawaannya begitu agresif sehingga membuat model ini tidak berfungsi secara efektif untuk riset sah dan pekerjaan defensif .

Inti kritiknya bukanlah pada keberadaan fitur keamanan, melainkan pada bagaimana fitur itu diimplementasikan: secara diam-diam, terlalu luas, dan dengan mekanisme fallback yang mengganti AI dengan yang kurang canggih tanpa sepengetahuan pengguna. Berikut adalah perincian kontroversi dan teknologi di baliknya.

Inti Kritik: Filter yang Terlalu Luas Merusak Pekerjaan yang Sah

Keluhan utama para peneliti adalah sensitivitas ekstrem dari pengklasifikasi konten Fable 5. Valentina “Chompie” Palmiotti, seorang peneliti keamanan terkemuka di IBM X-Force, mengatakan kepada TechCrunch bahwa model ini menolak "permintaan apa pun yang secara tangensial terkait siber—bahkan tugas-tugas tidak berbahaya seperti membaca postingan blog" . Ini berarti permintaan bantuan untuk memahami konsep dasar keamanan siber pun ikut ditandai, bukan hanya permintaan yang berbahaya.

Penandaan berlebihan ini berdampak negatif langsung pada kegunaan model. Ketika sebuah kueri ditandai, pengguna menerima respons yang 'diencerkan' dari AI yang lebih tua, sebuah pengalihan yang tidak diinformasikan secara eksplisit kepada mereka . Masalah ini diperparah oleh cara pengungkapan informasi tersebut. Para kritikus berpendapat bahwa perilaku ini hanya diungkapkan di bagian dalam kartu sistem (system card) setebal 319 halaman, yang memicu tuduhan bahwa Anthropic melakukan "sabotase rahasia" terhadap kemampuan model untuk pengguna tertentu .

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Cari dan periksa fakta dengan Studio Global AI

Orang-orang juga bertanya

Apa jawaban singkat untuk "Mengapa Pakar Keamanan Siber Menyebut Claude Fable 5 Milik Anthropic 'Terlalu Aman' untuk Digunakan"?

Apa poin penting yang harus divalidasi terlebih dahulu?

Apa yang harus saya lakukan selanjutnya dalam latihan?

Peluncuran model publik terbatas (Fable 5) bersamaan dengan model tak terbatas untuk mitra terverifikasi (Mythos 5) menandakan standar industri baru untuk deployment AI bertingkat, memicu pertanyaan tentang kesetaraan...

Sumber

Comments

0 comments

Loading comments...

Model	Ketersediaan	Konfigurasi Keamanan	Pengalaman Pengguna
Claude Fable 5	Publik (melalui API dan Claude.ai)	Pengklasifikasi ketat aktif; kueri sensitif secara diam-diam dialihkan ke Claude Opus 4.8 .	Seringkali menurun kualitasnya pada topik siber/bio/kimia, tanpa pengguna sadar akan pengalihan model .
Claude Mythos 5	Terbatas (hanya mitra Project Glasswing)	Pengklasifikasi dihapus; kemampuan penuh kelas Mythos tersedia .	Akses tanpa hambatan, tetapi hanya untuk beberapa lusin organisasi yang telah diperiksa sebelumnya .

Mengapa Pakar Keamanan Siber Menyebut Claude Fable 5 Milik Anthropic 'Terlalu Aman' untuk Digunakan

Inti Kritik: Filter yang Terlalu Luas Merusak Pekerjaan yang Sah

Search, cite, and publish your own answer

Orang-orang juga bertanya

Apa jawaban singkat untuk "Mengapa Pakar Keamanan Siber Menyebut Claude Fable 5 Milik Anthropic 'Terlalu Aman' untuk Digunakan"?

Apa poin penting yang harus divalidasi terlebih dahulu?

Apa yang harus saya lakukan selanjutnya dalam latihan?

Sumber

Comments

Cara Kerja Sistem Pagar Pembatas: Sebuah Saklar Diam-Diam

Pembenaran Anthropic untuk Penyetelan yang Konservatif

Pola Industri yang Mulai Muncul: Dua Model, Dua Tingkatan

Claude Fable 5 vs. Claude Mythos 5

Deployment AI Bertingkat Berdasarkan Kemampuan