تضع تقديرات المجتمع نافذة إصدار محتملة بين 15 يونيو و5 يوليو 2026، لكن هذا الجدول الزمني هو مجرد استقراء من مشاهدات السجلات وليس له أي دعم رسمي . لم تظهر أي أرقام ملموسة للتسعير أو كفاءة الرموز أو قدرات متعددة الوسائط مؤكدة لنموذج GPT‑5.6 الافتراضي؛ توقع تحسين الفعالية من حيث التكلفة وتوليد النص مع الصورة هو استدلال مستخلص من مسار عائلة 5.x، وليس مواصفة موثقة
.
الخلاصة: GPT‑5.6 هو تسريب موثوق، وليس منتجاً. الصناعة تراقب السلوك الخلفي، لكن لم يتم نشر أي تاريخ إطلاق أو ورقة مواصفات تقنية من قبل OpenAI .
تظهر عبارة "معيار Mythos" في عدة سياقات مختلفة، مما قد يخلق التباساً:
تسريب نموذج Claude Mythos من أنثروبيك (26 مارس 2026): تسبب خطأ في إعدادات نظام إدارة المحتوى الخاص بأنثروبيك في كشف حوالي 3,000 وثيقة داخلية عن طريق الخطأ، بما في ذلك مسودة منشور عن نموذج من الجيل القادم يحمل الاسم الرمزي "Capybara" والاسم الرسمي Claude Mythos . أظهرت المعايير الداخلية المسربة تحقيق Mythos لنتيجة 93.9% على معيار SWE‑bench Verified و 77.8% على معيار SWE‑bench Pro، متصدراً كل معيار رئيسي للبرمجة في ذلك الوقت
. في 7 أبريل 2026، أعلنت أنثروبيك رسمياً عن Claude Mythos Preview – لكنها صرحت في الوقت نفسه بأن الجمهور لا يمكنه استخدامه
. تم الإبلاغ أيضاً عن قدرات استثنائية في الأمن السيبراني للنموذج، بما في ذلك العثور على خطأ عمره 27 عاماً في نظام OpenBSD
.
معيار الأمن السيبراني لجامعة كارنيغي ميلون (مايو 2026): أنشأ باحثون في جامعة كارنيغي ميلون تقييماً منفصلاً يختبر ما إذا كانت نماذج الذكاء الاصطناعي يمكنها تطوير ثغرات متصفح حقيقية تستهدف محرك V8 من جوجل بشكل مستقل. أثبت كل من Claude Mythos و GPT‑5.5 قدرتهما على اكتشاف واستغلال عيوب أمنية حقيقية دون تدخل بشري، مع تفوق Mythos على GPT‑5.5 بهامش كبير بينما تبلغ تكلفة تشغيله حوالي اثني عشر ضعفاً .
معيار Mythos للثغرات من SecureAI (يناير 2026): مجموعة معايير تركز على الأمن السيبراني تغطي ثغرات CVE من 2023–2026، مصممة لتقييم كاشفات ثغرات الذكاء الاصطناعي، والتي تستخدم نماذج كبيرة مثل Llama‑3.1‑405B كخطوط أساس .
عندما يذكر شخص ما "تسريب معيار Mythos"، فهو يشير عادة إلى تسريب نموذج أنثروبيك. معايير CMU و SecureAI هي جهود منفصلة تشترك مع تسمية "Mythos" بشكل عرضي فقط.
في 2 يونيو 2026، وفي حدث "Intelligence at Work"، أعلنت OpenAI عن توسع هيكلي في Codex من وكيل برمجة يركز على المطورين إلى منصة عمل مؤسسية أوسع . الركائز الثلاث المؤكدة للإعلان هي:
أكدت OpenAI أيضاً أن Codex قد تجاوز 5 ملايين مستخدم نشط أسبوعياً . يمثل التوسع خطوة استراتيجية واضحة لاستقطاب العاملين في مجال المعرفة من غير المطورين داخل المؤسسة، وهو اتجاه حددته تحليلات مستقلة متعددة كمحور تنافسي مباشر ضد أدوات كانت تركز سابقاً بشكل شبه حصري على فرق الهندسة
.
في مؤتمرها السنوي Build في سان فرانسيسكو في 2 يونيو 2026، قدمت مايكروسوفت عائلة من سبعة نماذج ذكاء اصطناعي داخلية تحت العلامة التجارية الموحدة MAI (مايكروسوفت للذكاء الاصطناعي)، إلى جانب أجهزة جديدة .
محور الحدث هو MAI‑Thinking‑1، أول نموذج تفكير للشركة:
النماذج الستة الأخرى تكمّل منظومة متعددة الوسائط:
تضمنت إعلانات الأجهزة جهاز Surface RTX Spark Dev Box، وهو جهاز كمبيوتر مدمج لتطوير الذكاء الاصطناعي قادر على أداء يصل إلى بيتافلوب واحد من قدرة حوسبة الذكاء الاصطناعي مع 128 جيجابايت من الذاكرة الموحدة، ومصمم لتشغيل نماذج تصل إلى 120 مليار معامل محلياً . كما قدمت مايكروسوفت شريحة Majorana 2 الكمومية، مما يشير إلى تسارع طموحاتها في الأجهزة إلى ما هو أبعد من حوسبة الذكاء الاصطناعي الكلاسيكية
.
يتم تفسير عائلة نماذج MAI السبعة على نطاق واسع على أنها خطوة لتقليل الاعتماد على نماذج OpenAI مع إعطاء العملاء المؤسسيين بدائل داخلية تأتي مع ترخيص تجاري نظيف .
"البرمجة الإيحائية" (Vibe coding) – ممارسة توليد تطبيقات كاملة من خلال مطالبات حوارية بدلاً من كتابة الصيغ البرمجية – أنتجت جيلاً جديداً من المعايير التي تحاول قياس القدرة على بناء التطبيقات الكاملة بدلاً من مهام البرمجة المنعزلة:
تتقاسم هذه المنصات الثلاث هدف نقل تقييم البرمجة بالذكاء الاصطناعي إلى ما هو أبعد من معايير نسبة النجاح مثل SWE‑bench ونحو مقاييس شمولية لسهولة الاستخدام والسرعة والتكلفة والأمان.
في 2 يونيو 2026، أصدرت Nous Research Hermes Desktop كمعاينة عامة، مرفقاً مع Hermes Agent v0.15.2 ومنشوراً تحت ترخيص MIT لأنظمة macOS 12+ و Windows 10/11 و Linux .
كان Hermes في السابق متاحاً فقط من خلال واجهة سطر الأوامر أو بوابات المراسلة. تطبيق سطح المكتب هو واجهة أمامية رسومية أصلية تتشارك نفس نواة الوكيل ومفاتيح API والجلسات والمهارات والذاكرة مع واجهة CLI، لذا فهو واجهة بديلة وليس نسخة متشعبة .
تصف Nous Research Hermes بأنه "وكيل ذاتي التحسين، وليس مساعد برمجة" . نما الوكيل من الإطلاق إلى حوالي 180,000 نجمة على GitHub في حوالي ثلاثة أشهر، مما يجعله أحد أسرع مشاريع الوكلاء مفتوحة المصدر نمواً في المنظومة
.
أطلقت علي بابا Qwen 3.7 Plus في حوالي 1-2 يونيو 2026. إنه نموذج وكيل متعدد الوسائط يعالج النصوص والصور والفيديو من خلال تدريب دمج مبكر، مع نافذة سياق تبلغ مليون رمز .
تم تحديد التسعير بحوالي سدس تكلفة الرمز الواحد لنموذج Qwen 3.7 Max النصي فقط من علي بابا، مما يجعله أحد أكثر الوكلاء متعددي الوسائط بأسعار تنافسية في السوق . في معايير أداء الوكلاء، يتفوق Qwen 3.7 Plus على Claude Opus 4.6 في معيار Terminal‑Bench 2.0 وهو قادر على التعرف على واجهة المستخدم والأتمتة، وتوليد الشيفرات من الصور، والإجابة المرئية على الأسئلة
.
Claude Code هو أداة البرمجة الوكيلية من أنثروبيك التي تعمل مباشرة في الطرفية (Terminal)، وتنفذ أوامر الصدفة (shell) وتحرر الملفات على جهاز المطور. الأمر /fork ينشئ جلسة جديدة تتفرع من جلسة موجودة، مخزنة تحت commands/branch/، مما يتيح سير عمل حيث يمكن للمطورين استكشاف اتجاه مختلف دون فقدان السياق من الجلسة الأصلية .
أصبح Claude Code أحد أكثر أدوات تطوير الذكاء الاصطناعي اعتماداً، حيث جمع أحد الإشارات في حزمة npm أكثر من 1,100 نجمة و 1,900 تفرع في يوم واحد .
عدة بنود في الاستفسار الأصلي تفتقر إلى تأكيد مباشر من المصادر اعتباراً من أوائل يونيو 2026:
الموضوعات المهيمنة في الأسبوع الأول من يونيو 2026 هي الأدوات المؤسسية (إضافات ومواقع Codex)، وعائلات النماذج الداخلية (تشكيلة MAI من مايكروسوفت، و Qwen من علي بابا)، ونضج الوكلاء مفتوحة المصدر (Hermes Desktop)، وجيل قادم يلوح في الأفق لم يُعلن عنه بعد (GPT‑5.6، Claude Mythos). الصناعة تتحرك بسرعة – لكن التمييز بين المنتجات المؤكدة والشائعات غير المؤكدة هو أكثر وضوحاً مما توحي به العناوين الرئيسية في كثير من الأحيان.
Comments
0 comments