الإجاباتمنشورقبل 14 ساعةLast edited قبل 14 ساعة14 المصادر

ثورة الوكلاء الأذكياء: منصة Blackwell Ultra تسحق الأرقام القياسية في معيار AgentPerf الجديد

نتائج حصرية: منصة Blackwell Ultra من إنفيديا تتصدر أول معيار مفتوح لتقييم أداء 'الوكلاء الأذكياء' متعددي الموردين [4]. المعيار الجديد AgentPerf لا يقيس المحادثات التقليدية، بل يعيد تشغيل مسارات حقيقية لوكلاء برمجة يقومون باستدعاءات أدوات وسلاسل معقدة من الأوامر [4].

ابحث وتحقق من الحقائق مع Studio Global AI تصفّح المزيد من الصفحات الرائجة

1120

Nvidia Blackwell Ultra GPU architecture powering agentic AI infrastructure benchmarks — What did Nvidia achieve in the first published results of Artificial Analysis's AgentPerf benchmark, what does this new benchmark measure, aNvidia's Blackwell Ultra architecture is purpose-built for the demanding multi-step reasoning of agentic AI workloads. Image: AI-generated.
موجّه الذكاء الاصطناعي
Create a landscape editorial hero image for this Studio Global article: What did Nvidia achieve in the first published results of Artificial Analysis's AgentPerf benchmark, what does this new benchmark measure, a. Article summary: Here are the key findings from the first published results of Artificial Analysis's **AA-AgentPerf** benchmark, announced on June 12, 2026.. Topic tags: general, documentation, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "We measure real-world performance of AI accelerator systems during language model inference. ## AA-AgentPerf: The Hardware Benchmark for the Agent Era. AA-AgentPerf has been shaped" source context "AI Hardware Benchmarking & Performance Analysis" Reference image 2: visual subject "For years, co-founder and chief executive officer Jensen Huang and other higher-ups at Nvidia have
openai.com

في خطوة تؤكد تحول صناعة الذكاء الاصطناعي نحو عصر 'الوكلاء الأذكياء'، نُشرت اليوم 12 يونيو 2026 النتائج الأولى لمعيار AA-AgentPerf من شركة التحليلات المستقلة Artificial Analysis. لم تكن هذه مجرد أرقام قياسية جديدة، بل كانت أشبه ببيان رسمي من إنفيديا بأن منصتها الجديدة Blackwell Ultra ليست فقط للحاضر، بل صُممت لتكون حجر الأساس للمستقبل الوكيلي.

ما هو معيار AgentPerf ولماذا يختلف عن غيره؟

حتى وقت قريب، كانت معظم معايير قياس أداء الذكاء الاصطناعي تقيس قدرة النموذج على توليد رد واحد على سؤال واحد، كالمحادثات التقليدية. هذا لا يمثل الواقع الجديد. معيار AgentPerf هو الأول من نوعه في الصناعة، وهو مفتوح ومتعدد الموردين، صُمم خصيصاً لقياس أحمال عمل الاستدلال الوكيلي (Agentic AI Inference). هذه الأحمال تحاكي سيناريوهات معقدة يقوم فيها 'وكيل' ذكي بتنفيذ مهمة متعددة الخطوات، كأن يكتب كوداً، يختبره، يبحث في ملفات، ويُصحح أخطاءه، وكل ذلك في جلسة واحدة متصلة .

بدلاً من الأسئلة التركيبية، يقوم المعيار بإعادة تشغيل مسارات حقيقية لوكلاء برمجة مأخوذة من مستودعات عامة تضم أكثر من 12 لغة برمجة. هذه المسارات تتضمن سلسلة من استدعاءات نماذج اللغة الكبيرة (LLMs) واستدعاءات أدوات (تُحاكى بتأخيرات واقعية لوحدة المعالجة المركزية) وسياقات حوار متضخمة. الهدف النهائي هو قياس: كم عدد وكلاء البرمجة الذين يمكن لنظام استدلال واحد دعمهم بشكل متزامن مع الالتزام بأهداف مستوى خدمة (SLOs) محددة لسرعة توليد الرموز (Tokens) وزمن الوصول إلى الرمز الأول (TTFT) .

الطوفان الأسود: Blackwell Ultra يعيد كتابة القواعد

كانت النتيجة التي حققتها منصة إنفيديا GB300 NVL72، المبنية على معمارية Blackwell Ultra، صادمة للمحللين. على نموذج DeepSeek V4 Pro، وهو نموذج ضخم من فئة 'مزيج الخبراء' (MoE) يُمثل الطراز الأول في الذكاء الوكيلي، لم تتفوق المنصة فحسب، بل سحقت المنافسة .

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

ابحث وتحقق من الحقائق مع Studio Global AI

يسأل الناس أيضا

ما هي الإجابة المختصرة على "ثورة الوكلاء الأذكياء: منصة Blackwell Ultra تسحق الأرقام القياسية في معيار AgentPerf الجديد"؟

نتائج حصرية: منصة Blackwell Ultra من إنفيديا تتصدر أول معيار مفتوح لتقييم أداء 'الوكلاء الأذكياء' متعددي الموردين [4].

ما هي النقاط الأساسية التي يجب التحقق منها أولاً؟

ماذا يجب أن أفعل بعد ذلك في الممارسة العملية؟

سحق الأرقام: أداء يصل إلى 20 ضعفاً في عدد الوكلاء المتزامنين لكل ميغاواط مقارنة بمنصة Hopper من الجيل السابق [4].

المصادر

Comments

0 comments

Loading comments...