إذا كان المقصود بـ«الإطلاق» هو الإعلان العلني، فالإجابة نعم: صفحة Project Glasswing لدى Anthropic تحمل تاريخ 7 أبريل/نيسان 2026، وتصف المشروع بأنه مبادرة لتأمين البرمجيات الحيوية بدعم من Claude Mythos Preview. كما أن دليل بطاقات النماذج لدى Anthropic يضع Mythos Preview في خانة أبريل 2026.
أما إذا كان المقصود هو إطلاق تجاري أو عام لكل المستخدمين، فالإجابة لا. بطاقة النظام تقول صراحة إن Anthropic لم تطرح Claude Mythos Preview للتوافر العام.
Project Glasswing ليس صفحة تسويق لنموذج دردشة جديد. Anthropic تصفه بأنه مبادرة لحماية أكثر البرمجيات أهمية في عصر الذكاء الاصطناعي، وتقول إن المبادرة مدعومة بما وصفته بأنه أقوى نموذج لديها حتى ذلك الوقت: Claude Mythos Preview.
هذا يشرح سبب الحذر في إتاحته. بحسب بطاقة النظام، القدرات المرتبطة باكتشاف الثغرات وإصلاحها قد تفيد الدفاع السيبراني، لكنها قد تُستخدم أيضاً لتصميم طرق أكثر تقدماً لاستغلال تلك الثغرات؛ ولهذا تقول Anthropic إنها اختارت عدم طرحه للعامة.
وتتسق مدونة فريق الاختبار الأحمر لدى Anthropic مع هذا التفسير: فقد قُدّم Mythos Preview في البداية عبر Project Glasswing لمجموعة محدودة من شركاء الصناعات الحيوية ومطوري البرمجيات المفتوحة، بهدف تمكين المدافعين من تقوية الأنظمة المهمة قبل أن تصبح نماذج بقدرات مشابهة أوسع انتشاراً.
في المقارنة التي نشرتها Anthropic، جاءت نتائج Claude Mythos Preview أعلى من Claude Opus 4.6 في كل المقاييس المدرجة أدناه:
| المعيار | Claude Mythos Preview | Claude Opus 4.6 |
|---|---|---|
| GPQA Diamond | 94.6% | 91.3% |
| Humanity’s Last Exam، من دون أدوات | 56.8% | 40.0% |
| Humanity’s Last Exam، مع أدوات | 64.7% | 53.1% |
| BrowseComp | 86.9% | 83.7% |
| OSWorld-Verified | 79.6% | 72.7% |
وتضيف Anthropic أن Mythos Preview لم يحقق نتيجة أعلى في BrowseComp فقط، بل استخدم رموزاً أقل بمقدار 4.9× مقارنة بـ Opus 4.6.
بالمعنى العملي، تشير هذه الأرقام إلى نموذج قوي جداً في الاختبارات التي تقيس التفكير الصعب، واستخدام الأدوات، والتصفح، والتعامل مع بيئات حاسوبية. لكن هذا لا يعني تلقائياً أنه سيكون الأفضل في كل مهمة يومية، أو في كل لغة، أو في كل تجربة استخدام.
هناك ثلاثة أسباب تدعو إلى قراءة النتائج بهدوء.
أولاً، الأرقام المباشرة المتاحة هنا منشورة من Anthropic نفسها، وليست نتيجة إعادة اختبار مستقلة منشورة من جهة خارجية. هذا لا يلغي قيمتها، لكنه يحدد إطارها: نحن نتحدث عن نتائج رسمية، لا عن إجماع خارجي كامل.
ثانياً، Anthropic نفسها وضعت ملاحظة مهمة على Humanity’s Last Exam: استمرار أداء Mythos الجيد في وضع الجهد المنخفض قد يشير إلى درجة ما من الحفظ أو التعرّف المسبق على محتوى الاختبار. لذلك ينبغي ألا يُقرأ هذا الرقم وحده كدليل قاطع على تفوق مماثل في كل مسألة غير مرئية.
ثالثاً، مواد المخاطر والمواءمة لا ترسم صورة تفوق مطلق في كل تفصيل. في تحديث مخاطر Claude Mythos Preview، تقول Anthropic إن أداء Mythos في Minimal-LinuxBench كان، بحسب الإعداد، أعلى قليلاً أو أدنى قليلاً من Claude Opus. كما تذكر أن معدل نجاح التخفي في SHADE-Arena، عند وجود نسخ طويلة لسلسلة التفكير، ارتفع من نحو 0% إلى نحو 3.8%.
الخلاصة المنصفة: Claude Mythos Preview يبدو أقوى بوضوح من Claude Opus 4.6 في مقاييس Anthropic المعلنة، لكن الأدلة العامة لا تكفي للجزم بأنه يتفوق في كل حالات الاستخدام، مثل الكتابة اليومية، أو السرعة، أو التكلفة، أو تجربة المستخدم العادي.
لا ينبغي التعامل مع Claude Mythos Preview كأنه نسخة جديدة متاحة للجميع داخل Claude.ai أو عبر واجهة API عادية. بطاقة النظام تقول إن Anthropic لم تطرحه للتوافر العام، وإن الوصول أُتيح لعدد من المؤسسات الشريكة التي تحافظ على بنى برمجية مهمة، وبشروط تقصر الاستخدام على الأمن السيبراني.
لذلك، إذا كان سؤالك العملي هو: هل يمكنني اختياره من واجهة Claude؟ ما سعره؟ ما زمن الاستجابة؟ ما حجم نافذة السياق؟ فالمواد العامة المتاحة لا تقدم إجابات كاملة كمنتج موجه للجمهور. ما تكشفه Anthropic حتى الآن هو نموذج معاينة عالي القدرة وحساس الاستخدام، موجّه أساساً لأعمال دفاعية في أمن البرمجيات.
Claude Mythos Preview ظهر علناً في أبريل/نيسان 2026 عبر Project Glasswing، ونتائجه الرسمية تجعله من أقوى ما أعلنت عنه Anthropic في تلك المقاييس. لكنه ليس «Claude الجديد» المتاح للجميع. إنه نموذج معاينة محدود، موجّه لحماية البرمجيات الحساسة وشركاء الأمن السيبراني، لا لاستخدام يومي عام.
للمستخدم العادي، أهم معلومة ليست أنه أقوى من Opus 4.6 في عدة اختبارات، بل أنه ببساطة ليس خياراً متاحاً للاستخدام المباشر حالياً.
Comments
0 comments