För perspektiv: I samma test nådde en enskild B300-nod (disaggregerad) 21 053 agenter per megawatt, medan AMD:s MI355X nådde 3 551 och föregående generation H200 stannade på 2 594 .
Dessa resultat är inte en isolerad händelse. De är en del av en medveten, mångsidig satsning för att etablera Blackwell Ultra som den definitiva plattformen för storskalig agent-AI:
Nvidia tillskriver den stora prestandaökningen till extrem samdesign: NVLink skalar upp och knyter samman 72 GPU:er i ett enhetligt tyg, CUDA-kärnor överlappar kommunikation och beräkning för MoE-modeller, och TensorRT LLM-optimeringar (WideEP/DeepEP, DeepGEMM, fused MoE) upprätthåller effektiviteten även när antalet samtidiga agentsessioner ökar kraftigt .
AgentPerf lägger till en agentdimension till Nvidias redan breda svit av MLPerf-resultat. I MLPerf Inference v5.1 satte Blackwell Ultra rekord med 1,4 gånger högre DeepSeek-R1-genomströmning jämfört med Blackwell . I MLPerf Training v5.1 sopade Nvidia hem alla sju benchmarktesterna och satte bland annat nytt rekord för Llama 3.1 405B-förträning med 10 minuter på 5 120 Blackwell-GPU:er
.
För att visa att plattformen är produktionsredo, inte bara benchmarkstark, lyfter Nvidia fram att partners som Together AI (som driver Cursors agentiska kodning) och DeepInfra (som driver Pam.ai:s AI-arbetsstyrka) redan kör agentarbetsbelastningar på Blackwell . Detta är tydliga signaler till marknaden att hårdvaran är redo för skarp drift.
Blogginlägget antyder också nästa steg: nästa generations Vera Rubin-arkitektur, som nu är i produktion, utlovas bli nästa språng för agent-AI-kapacitet . Den tekniska djupdykningen nämner förväntade förbättringar från 50 PFLOPS NVFP4-beräkningskraft och förbättrad acceleration av LLM-verktygsanrop
.
För svenska företag och organisationer som bygger eller planerar att bygga agentbaserade AI-tjänster – från kodassistenter till autonoma arbetsflöden – är riktningen tydlig. Energieffektivitet per agentuppgift blir en allt viktigare måttstock, särskilt i en svensk kontext där hållbarhetskrav och elpriser gör effekt per megawatt till en direkt ekonomisk faktor. Att infrastruktur nu kan hantera tiotusentals samtidiga agenter med bibehållen svarstid öppnar för helt nya tillämpningar i produktionsskala.
Comments
0 comments