AnswersPublished3 days agoLast edited 3 days ago32 sources

Penyelidik Keselamatan Siber Kecam Claude Fable 5 Anthropic Kerana Sekatan Melampau dan Pertukaran Model Rahsia

Penyelidik keselamatan siber mengecam model AI Claude Fable 5 kerana penapis keselamatannya secara agresif menyekat pertanyaan berkaitan keselamatan yang tidak berbahaya dan secara rahsia beralih ke model yang lebih l... Kontroversi tertumpu pada mekanisme yang menghalakan semula pertanyaan tentang keselamatan siber...

Search & fact-check with Studio Global AI Browse more Trending pages

27K0

A conceptual illustration of a locked digital shield representing AI safety guardrails, with glowing data streams being filtered and diverted, set against a dark cybersecurity-them — What is causing cybersecurity professionals to criticize Anthropic's Claude Fable 5, and how does the model's safety guardrail system work,Anthropic's Claude Fable 5 uses aggressive, silent guardrails to keep its most powerful capabilities out of public hands, a move that has sparked intense debate in the cybersecurity community.
AI Prompt
Create a landscape editorial hero image for this Studio Global article: What is causing cybersecurity professionals to criticize Anthropic's Claude Fable 5, and how does the model's safety guardrail system work,. Article summary: Anthropic released Claude Fable 5 on June 9, 2026 as a guardrailed public version of its powerful Mythos-class model, alongside an unrestricted twin, Claude Mythos 5, available only to vetted partners through Project Gla. Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Claude Fable 5: Why Anthropic Put Its Most Powerful AI Behind Guardrails. * Anthropic released Claude Fable 5 on 9 June 2026. It is the first publicly available Mythos-class mode" source context "Claude Fable 5: Anthropic Locks Down Cyber and Bio" Reference image 2: visual subject "# Anthropic says these topics
openai.com

Anthropic melancarkan Claude Fable 5 pada 9 Jun 2026, sebagai model AI termaju mereka yang tersedia untuk orang ramai, namun pelancarannya menerima kritikan bertubi-tubi daripada komuniti keselamatan siber . Walaupun syarikat itu meletakkan model ini sebagai pelepasan teknologi kelas Mythos yang bertanggungjawab, para profesional keselamatan berpendapat bahawa pagar keselamatan (safety guardrails) terbina dalamnya terlalu agresif sehingga menyebabkan model itu tidak berguna untuk kerja-kerja penyelidikan dan pertahanan yang sah .

Inti pati kritikan bukanlah pada kewujudan ciri-ciri keselamatan itu, tetapi bagaimana ia dilaksanakan: secara senyap, meluas, dan dengan mekanisme sandaran yang menggantikannya dengan AI yang kurang berkebolehan tanpa pengetahuan pengguna. Berikut adalah perincian kontroversi dan teknologi di sebaliknya.

Kritikan: Penapis Melampau Menyekat Kerja Sah

Isu utama yang dibangkitkan oleh penyelidik ialah sensitiviti melampau pengelas kandungan (content classifiers) Fable 5. Valentina “Chompie” Palmiotti, seorang penyelidik keselamatan terkemuka di IBM X-Force, memberitahu TechCrunch bahawa model itu menolak “sebarang permintaan yang secara tidak langsung berkaitan siber—malah tugas-tugas tidak berbahaya seperti membaca catatan blog” . Ini bermakna permintaan untuk bantuan memahami konsep asas keselamatan siber turut ditandakan, bukan hanya yang berbahaya.

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Model	Ketersediaan	Konfigurasi Keselamatan	Pengalaman Pengguna
Claude Fable 5	Awam (melalui API dan Claude.ai)	Pengelas ketat aktif; pertanyaan sensitif dihalakan secara senyap ke Claude Opus 4.8 .	Sering merosot kualitinya pada topik siber/bio/kimia, dengan pengguna tidak menyedari pertukaran model .
Claude Mythos 5	Terhad (rakan kongsi Project Glasswing sahaja)	Pengelas dialih keluar; keupayaan penuh kelas Mythos tersedia .	Akses tanpa halangan, tetapi hanya untuk beberapa dozen organisasi yang telah diteliti .

Penyelidik Keselamatan Siber Kecam Claude Fable 5 Anthropic Kerana Sekatan Melampau dan Pertukaran Model Rahsia

Kritikan: Penapis Melampau Menyekat Kerja Sah

Search, cite, and publish your own answer

People also ask

What is the short answer to "Penyelidik Keselamatan Siber Kecam Claude Fable 5 Anthropic Kerana Sekatan Melampau dan Pertukaran Model Rahsia"?

What are the key points to validate first?

What should I do next in practice?

Sources

Comments

Cara Sistem Pagar Keselamatan Berfungsi: Pertukaran Senyap

Bagaimana Anthropic Mewajarkan Penalaan Konservatif

Corak Industri yang Muncul: Dua Model, Dua Peringkat

Claude Fable 5 lwn. Claude Mythos 5

Penggunaan AI Bertingkat Keupayaan