الإجاباتمنشورقبل 3 أيامLast edited قبل 3 أيام32 المصادر

خبراء الأمن السيبراني ينتقدون أنثروبيك: نموذج Claude Fable 5 'آمن جدًا' بحيث أصبح غير صالح للاستخدام

باحثو الأمن السيبراني ينتقدون نموذج Claude Fable 5 من أنثروبيك بسبب حواجز حماية مفرطة تحظر حتى الاستفسارات الأمنية البريئة وتتحول بصمت إلى نموذج أضعف دون إخبار المستخدم، مما يجعل النموذج 'غير صالح للاستخدام' في الأعما... يكمن جوهر الانتقاد في آلية تصنيف تعيد توجيه الطلبات المتعلقة بالأمن السيبراني والأحياء والكيمياء...

ابحث وتحقق من الحقائق مع Studio Global AI تصفّح المزيد من الصفحات الرائجة

39K0

A conceptual illustration of a locked digital shield representing AI safety guardrails, with glowing data streams being filtered and diverted, set against a dark cybersecurity-them — What is causing cybersecurity professionals to criticize Anthropic's Claude Fable 5, and how does the model's safety guardrail system work,Anthropic's Claude Fable 5 uses aggressive, silent guardrails to keep its most powerful capabilities out of public hands, a move that has sparked intense debate in the cybersecurity community.
موجّه الذكاء الاصطناعي
Create a landscape editorial hero image for this Studio Global article: What is causing cybersecurity professionals to criticize Anthropic's Claude Fable 5, and how does the model's safety guardrail system work,. Article summary: Anthropic released Claude Fable 5 on June 9, 2026 as a guardrailed public version of its powerful Mythos-class model, alongside an unrestricted twin, Claude Mythos 5, available only to vetted partners through Project Gla. Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Claude Fable 5: Why Anthropic Put Its Most Powerful AI Behind Guardrails. * Anthropic released Claude Fable 5 on 9 June 2026. It is the first publicly available Mythos-class mode" source context "Claude Fable 5: Anthropic Locks Down Cyber and Bio" Reference image 2: visual subject "# Anthropic says these topics
openai.com

في التاسع من يونيو 2026، أطلقت شركة أنثروبيك (Anthropic) نموذجها الأحدث والأقوى للعامة، Claude Fable 5. لكن بدلاً من الاحتفاء، قوبل الإطلاق بموجة عارمة من الانتقادات من مجتمع الأمن السيبراني. بينما تقدم الشركة النموذج كإصدار 'مسؤول' من تقنيتها فائقة التطور من فئة 'ميثوس' (Mythos-class)، يرى خبراء الأمن أن حواجز الحماية المدمجة صارمة جدًا لدرجة أنها تجعل النموذج عديم الفائدة عمليًا لأعمال البحث والدفاع المشروعة .

جوهر المشكلة ليس وجود ميزات الأمان بحد ذاتها، بل الطريقة التي طُبقت بها: بصمت، وبشكل واسع، ومع آلية احتياطية تستبدل النموذج بآخر أقل ذكاءً دون علم المستخدم. إليكم تفصيل للجدل القائم والتقنية التي تقف خلفه.

الانتقاد: مرشحات واسعة جدًا تعطل العمل المشروع

الشكوى الأساسية للباحثين هي الحساسية المفرطة لمصنفات المحتوى في Fable 5. وصفت فالنتينا 'تشومبي' بالميوتي، الباحثة الأمنية البارزة في فريق IBM X-Force، الوضع لموقع TechCrunch بقولها: 'يرفض [Fable 5] أي طلب يمكن أن يكون له علاقة ولو بشكل عرضي بالأمن السيبراني – حتى المهام غير الضارة مثل قراءة منشور مدونة' . هذا يعني أن طلبات المساعدة لفهم مفاهيم أساسية في الأمن السيبراني يتم حظرها، وليس فقط الطلبات الخطيرة.

لهذا الحظر المفرط تأثير سلبي مباشر على فائدة النموذج. عندما يتم الإبلاغ عن استفسار، يتلقى المستخدم ردًا مخففًا من نموذج ذكاء اصطناعي أقدم، وهو تحويل لا يتم إبلاغه به صراحةً . تتفاقم المشكلة بسبب كيفية الكشف عن هذه المعلومة؛ يقول النقاد إن هذا السلوك لم يُكشف عنه إلا مدفونًا في عمق 'بطاقة نظام' (System Card) تقع في 319 صفحة، مما أدى إلى اتهامات بأن أنثروبيك انخرطت في 'تخريب سري' لقدرات النموذج لبعض المستخدمين .

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

ابحث وتحقق من الحقائق مع Studio Global AI

يسأل الناس أيضا

ما هي الإجابة المختصرة على "خبراء الأمن السيبراني ينتقدون أنثروبيك: نموذج Claude Fable 5 'آمن جدًا' بحيث أصبح غير صالح للاستخدام"؟

ما هي النقاط الأساسية التي يجب التحقق منها أولاً؟

ماذا يجب أن أفعل بعد ذلك في الممارسة العملية؟

إطلاق نموذج عام مقيد (Fable 5) جنبًا إلى جنب مع نموذج غير مقيد للشركاء الموثوقين (Mythos 5) يشير إلى معيار صناعي جديد لنشر الذكاء الاصطناعي القائم على 'مستويات القدرات'، مما يثير تساؤلات حول الشفافية والإنصاف وما إذا...

المصادر

Comments

0 comments

Loading comments...

النموذج	الإتاحة	إعدادات الأمان	تجربة المستخدم
Claude Fable 5	عام (عبر API و Claude.ai)	مصنفات صارمة نشطة؛ الاستفسارات الحساسة توجه بصمت إلى Claude Opus 4.8 .	غالبًا ما يتدهور الأداء في موضوعات الأمن السيبراني/الأحياء/الكيمياء، مع عدم وعي المستخدمين بتبديل النموذج .
Claude Mythos 5	مقيد (شركاء مشروع Glasswing فقط)	المصنفات مُزالة؛ قدرات فئة Mythos الكاملة متاحة .	وصول غير معاق، ولكن فقط لعشرات المنظمات التي تم فحصها مسبقًا .

خبراء الأمن السيبراني ينتقدون أنثروبيك: نموذج Claude Fable 5 'آمن جدًا' بحيث أصبح غير صالح للاستخدام

الانتقاد: مرشحات واسعة جدًا تعطل العمل المشروع

Search, cite, and publish your own answer

يسأل الناس أيضا

ما هي الإجابة المختصرة على "خبراء الأمن السيبراني ينتقدون أنثروبيك: نموذج Claude Fable 5 'آمن جدًا' بحيث أصبح غير صالح للاستخدام"؟

ما هي النقاط الأساسية التي يجب التحقق منها أولاً؟

ماذا يجب أن أفعل بعد ذلك في الممارسة العملية؟

المصادر

Comments

كيف يعمل نظام الحواجز: مفتاح تحويل صامت

كيف تبرر أنثروبيك الضبط المتحفظ

النمط الصناعي الناشئ: نموذجان، مستويان

Claude Fable 5 مقابل Claude Mythos 5

نشر الذكاء الاصطناعي القائم على مستويات القدرات