في خطوة تؤكد تحول صناعة الذكاء الاصطناعي نحو عصر 'الوكلاء الأذكياء'، نُشرت اليوم 12 يونيو 2026 النتائج الأولى لمعيار AA-AgentPerf من شركة التحليلات المستقلة Artificial Analysis. لم تكن هذه مجرد أرقام قياسية جديدة، بل كانت أشبه ببيان رسمي من إنفيديا بأن منصتها الجديدة Blackwell Ultra ليست فقط للحاضر، بل صُممت لتكون حجر الأساس للمستقبل الوكيلي.
ما هو معيار AgentPerf ولماذا يختلف عن غيره؟
حتى وقت قريب، كانت معظم معايير قياس أداء الذكاء الاصطناعي تقيس قدرة النموذج على توليد رد واحد على سؤال واحد، كالمحادثات التقليدية. هذا لا يمثل الواقع الجديد. معيار AgentPerf هو الأول من نوعه في الصناعة، وهو مفتوح ومتعدد الموردين، صُمم خصيصاً لقياس أحمال عمل الاستدلال الوكيلي (Agentic AI Inference). هذه الأحمال تحاكي سيناريوهات معقدة يقوم فيها 'وكيل' ذكي بتنفيذ مهمة متعددة الخطوات، كأن يكتب كوداً، يختبره، يبحث في ملفات، ويُصحح أخطاءه، وكل ذلك في جلسة واحدة متصلة
.
بدلاً من الأسئلة التركيبية، يقوم المعيار بإعادة تشغيل مسارات حقيقية لوكلاء برمجة مأخوذة من مستودعات عامة تضم أكثر من 12 لغة برمجة. هذه المسارات تتضمن سلسلة من استدعاءات نماذج اللغة الكبيرة (LLMs) واستدعاءات أدوات (تُحاكى بتأخيرات واقعية لوحدة المعالجة المركزية) وسياقات حوار متضخمة. الهدف النهائي هو قياس: كم عدد وكلاء البرمجة الذين يمكن لنظام استدلال واحد دعمهم بشكل متزامن مع الالتزام بأهداف مستوى خدمة (SLOs) محددة لسرعة توليد الرموز (Tokens) وزمن الوصول إلى الرمز الأول (TTFT)
.
الطوفان الأسود: Blackwell Ultra يعيد كتابة القواعد
كانت النتيجة التي حققتها منصة إنفيديا GB300 NVL72، المبنية على معمارية Blackwell Ultra، صادمة للمحللين. على نموذج DeepSeek V4 Pro، وهو نموذج ضخم من فئة 'مزيج الخبراء' (MoE) يُمثل الطراز الأول في الذكاء الوكيلي، لم تتفوق المنصة فحسب، بل سحقت المنافسة
.
Comments
0 comments