V pracovní zátěži s modelem DeepSeek V4 Pro, což je velký model typu Mixture-of-Experts (MoE) reprezentující špičkovou agentní AI , dosáhla Nvidia následujících výsledků:
Tyto výsledky nejsou izolovanou událostí. Jde o další krok v pečlivě budované narativní linii, která staví Blackwell Ultra do role jediné smysluplné platformy pro nastupující vlnu agentní AI.
1. Narativ plné optimalizace stacku
Nvidia nepřipisuje 20× zisk pouze hrubému výkonu GPU. Zdůrazňuje extrémní ko-design hardwaru a softwaru: propojení 72 GPU do jediné tkaniny přes NVLink, CUDA kernely překrývající komunikaci a výpočty pro MoE modely a knihovnu TensorRT LLM s optimalizacemi jako WideEP/DeepEP, DeepGEMM a fused MoE, které udržují vysokou efektivitu i při škálování počtu agentů .
2. Rozšíření benchmarkové dominance
AgentPerf skvěle doplňuje už tak suverénní výsledky v tradičních benchmarcích MLPerf Inference a Training. Blackwell Ultra zde již dříve stanovil rekordy v MLPerf Inference v5.1 (1,4× vyšší propustnost DeepSeek-R1 oproti Blackwellu) a ovládl všech sedm testů v MLPerf Training v5.1, včetně natrénování modelu Llama 3.1 405B za pouhých 10 minut na 5 120 GPU
.
3. Důkazy z reálného ekosystému
Aby Nvidia ukázala, že nejde jen o laboratorní čísla, upozorňuje na partnery jako Together AI (pohání kódovací agenty v Cursoru) a DeepInfra (pohání AI pracovní sílu v Pam.ai), kteří již na Blackwellech reálně provozují agentní zátěže . Tím posiluje obraz platformy jako produkčně připravené, nikoli jen „benchmarkově silné“.
4. Výhled do budoucna
Článek na blogu Nvidie také explicitně naznačuje další evoluci. Příští architektura Vera Rubin, která je již ve výrobě, se má stát dalším milníkem pro kapacitu agentní AI . Technické detaily navíc zmiňují plánovaný skok na 50 PFLOPs výpočtu NVFP4 a vylepšenou akceleraci volání nástrojů LLM
. Tím Nvidia dává najevo, že éra Blackwell Ultra je jen začátkem.
Comments
0 comments