AntwortenVeröffentlichtvor 14 StundenLast edited vor 13 Stunden14 Quellen

Nvidia dominiert ersten Agentic-AI-Benchmark: 20x mehr KI-Coding-Agenten pro Megawatt

Suchen und Fakten prüfen mit Studio Global AI Mehr Trendseiten ansehen

3.2K0

Nvidia Blackwell Ultra GPU architecture powering agentic AI infrastructure benchmarks — What did Nvidia achieve in the first published results of Artificial Analysis's AgentPerf benchmark, what does this new benchmark measure, aNvidia's Blackwell Ultra architecture is purpose-built for the demanding multi-step reasoning of agentic AI workloads. Image: AI-generated.
KI-Prompt
Create a landscape editorial hero image for this Studio Global article: What did Nvidia achieve in the first published results of Artificial Analysis's AgentPerf benchmark, what does this new benchmark measure, a. Article summary: Here are the key findings from the first published results of Artificial Analysis's **AA-AgentPerf** benchmark, announced on June 12, 2026.. Topic tags: general, documentation, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "We measure real-world performance of AI accelerator systems during language model inference. ## AA-AgentPerf: The Hardware Benchmark for the Agent Era. AA-AgentPerf has been shaped" source context "AI Hardware Benchmarking & Performance Analysis" Reference image 2: visual subject "For years, co-founder and chief executive officer Jensen Huang and other higher-ups at Nvidia have
openai.com

Am 12. Juni 2026 veröffentlichte Artificial Analysis die ersten Ergebnisse seines neuen Benchmarks AA-AgentPerf – und Nvidias Plattform setzte sich prompt an die Spitze. Die Resultate liefern nicht nur beeindruckende Zahlen, sondern markieren auch einen Paradigmenwechsel in der Bewertung von KI-Infrastruktur: Weg von Chat-Komplettierungen, hin zu echten, mehrschrittigen Agenten-Workloads.

Was misst AgentPerf – und warum ist das neu?

Herkömmliche KI-Benchmarks wie MLPerf Inference konzentrieren sich meist auf einzelne Inferenz-Anfragen – ein Modell bekommt einen Prompt und liefert eine Antwort. Agentenbasierte KI, die beispielsweise autonom Code schreibt, Tools nutzt oder Pläne erstellt, verhält sich fundamental anders: Sie erzeugt lange, kontextreiche Interaktionsketten mit vielen aufeinanderfolgenden LLM-Aufrufen, simulierten Werkzeugzugriffen und stetig wachsenden Eingabefenstern .

Der AA-AgentPerf-Benchmark wurde genau für diese Art von Workloads entwickelt. Statt synthetischer Prompts spielt er reale Trajektorien von Coding-Agenten aus öffentlichen Repositories nach – über 12+ Programmiersprachen hinweg und mit Workflows, die bis zu 20 aufeinanderfolgende LLM-Aufrufe sowie Tool Calls beinhalten . Dabei werden auch typische CPU-Latenzen für Werkzeugaufrufe simuliert, um die realistische Belastung einer Infrastruktur abzubilden.

Gemessen wird letztlich, wie viele gleichzeitige Agenten ein Beschleunigersystem unterstützen kann, während es definierte Service-Level-Ziele (SLOs) einhält – konkret die Ausgabegeschwindigkeit in Token pro Sekunde (T/s) und die Zeit bis zum ersten Token (Time-to-First-Token, TTFT). Die Ergebnisse werden zur besseren Vergleichbarkeit sowohl pro Beschleuniger als auch pro Megawatt (MW) normalisiert .

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Suchen und Fakten prüfen mit Studio Global AI

Die Leute fragen auch

Wie lautet die kurze Antwort auf „Nvidia dominiert ersten Agentic-AI-Benchmark: 20x mehr KI-Coding-Agenten pro Megawatt“?

Was sind die wichtigsten Punkte, die zuerst validiert werden müssen?

Artificial Analysis veröffentlichte am 12. Juni 2026 die ersten Ergebnisse seines neuen AA AgentPerf Benchmarks – der ersten branchenweiten, offenen und Multi Vendor Hardware Messung speziell für agentenbasierte KI In... Nvidias GB300 NVL72 (Blackwell Ultra) erzielte die höchste Leistung aller getesteten Plattformen und unterstützt bis zu 20 mal mehr gleichzeitige Agenten pro Megawatt als das Nvidia HGX H200 (Hopper) System [4].

Was soll ich als nächstes in der Praxis tun?

Der Benchmark repliziert reale Coding Agenten Trajektorien aus öffentlichen Repositories, die bis zu 20 aufeinanderfolgende LLM Aufrufe und Tool Calls umfassen und so praxisnahe Workloads abbilden [4].

Quellen

Comments

0 comments

Loading comments...

Nvidia dominiert ersten Agentic-AI-Benchmark: 20x mehr KI-Coding-Agenten pro Megawatt

Was misst AgentPerf – und warum ist das neu?

Search, cite, and publish your own answer

Die Leute fragen auch

Wie lautet die kurze Antwort auf „Nvidia dominiert ersten Agentic-AI-Benchmark: 20x mehr KI-Coding-Agenten pro Megawatt“?

Was sind die wichtigsten Punkte, die zuerst validiert werden müssen?

Was soll ich als nächstes in der Praxis tun?

Quellen

Comments

Nvidias Ergebnisse: Was hat Blackwell Ultra erreicht?

Das große Ganze: Nvidias Strategie für agentenbasierte KI

1. Ganzheitliche Optimierung als Narrativ

2. Ausbau der Benchmark-Dominanz

3. Ökosystem-Beweise für die Praxis

4. Ausblick auf Vera Rubin

Einordnung: Vom Chatbot zur autonomen Software-Entwicklung