आर्टिफिशियल इंटेलिजेंस की दुनिया में अब चैटबॉट्स का जमाना पीछे छूट रहा है। अब बाजी उन AI एजेंटों की है जो खुद से सोचते हैं, योजना बनाते हैं और काम को अंजाम देते हैं। इसी नए युग में हार्डवेयर की असली ताकत को मापने के लिए 12 जून, 2026 को पहला बेंचमार्क जारी किया गया, और Nvidia ने इसमें अपना लोहा मनवा लिया।
AgentPerf क्या है और यह अलग क्यों है?
AA-AgentPerf कोई आम बेंचमार्क नहीं है। यह इंडस्ट्री का पहला ओपन, मल्टी-वेंडर हार्डवेयर बेंचमार्क है जिसे खास तौर पर एजेंटिक AI इन्फ्रेंस वर्कलोड के लिए डिजाइन किया गया है, न कि सिंगल-टर्न चैट कम्प्लीशंस के लिए
।
सरल शब्दों में समझें तो, यह इस बात का परीक्षण करता है कि एक AI सिस्टम कितने सारे "AI कोडिंग एजेंटों" को एक साथ संभाल सकता है, जबकि उसकी रफ्तार और प्रतिक्रिया का समय (आउटपुट टोकन स्पीड और टाइम-टू-फर्स्ट-टोकन) तय सर्विस लेवल (SLO) के अंदर बना रहे।
इस बेंचमार्क की सबसे खास बात इसकी असलियत है। इसे 12 से ज्यादा प्रोग्रामिंग लैंग्वेज वाले पब्लिक रिपॉजिटरी से ली गई असली कोडिंग एजेंट ट्रैजेक्टरीज पर आधारित किया गया है। यह सिर्फ एक सवाल-जवाब नहीं, बल्कि एलएलएम कॉल, टूल कॉल (सीपीयू डिले की असली नकल) और बढ़ते कॉन्टेक्स्ट विंडो की पूरी चेन को दोहराता है
। और हां, नतीजे हर एक्सेलरेटर और प्रति मेगावाट (MW) के हिसाब से नॉर्मलाइज़ किए जाते हैं, ताकि तुलना सही मायनों में हो सके
।
Nvidia के धमाकेदार नतीजे
पहले ही राउंड में Nvidia के नए प्लेटफॉर्म ने जो किया, उसने सबको चौंका दिया। परीक्षण डीपसीक V4 प्रो पर हुआ, जो एक बड़ा मिक्सचर-ऑफ-एक्सपर्ट्स (MoE) मॉडल है और फ्रंटियर एजेंटिक AI का प्रतिनिधित्व करता है।
- सबसे तेज परफॉरमेंस: Nvidia GB300 NVL72 (ब्लैकवेल अल्ट्रा) ने टेस्ट किए गए सभी प्लेटफॉर्म्स को पीछे छोड़ते हुए सबसे ज्यादा प्रदर्शन किया
।
Comments
0 comments