NVIDIA在MLPerf Training v6.0中大获全胜,凭借Blackwell平台成为唯一提交全部7项测试的厂商,并包揽所有项目的冠军 [3]。 MLCommons首次引入了两个全新的混合专家(MoE)模型预训练基准:DeepSeek V3(总参数6710亿,单Token激活370亿)和GPT OSS 20B,NVIDIA是唯一在这两个新基准上都提交了成绩的平台 [3][10]。

Create a landscape editorial hero image for this Studio Global article: What are the key highlights from the MLPerf Training v6.0 results, including Nvidia's performance across all benchmarks on its Blackwell pla. Article summary: ## MLPerf Training v6.0 Key Highlights. Topic tags: general, documentation, news, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "Home » News » NVIDIA Sets MLPerf Inference v6.0 Records with Blackwell Ultra Platform. # NVIDIA Sets MLPerf Inference v6.0 Records with Blackwell Ultra Platform. NVIDIA has publish" source context "NVIDIA Sets MLPerf Inference v6.0 Records with Blackwell Ultra Platform - StorageReview.com" Reference image 2: visual subject "# MLPerf Inference v6.0 Results Explained: GPU Performance Rankings for AI Workloads (2026). MLPerf Inference v6.0 results dropped April 1, 2026, and
NVIDIA在MLPerf Training v6.0中取得了压倒性胜利,包揽了所有基准测试的冠军。无论是在规模化训练的最短耗时,还是单加速器的最高性能上,NVIDIA都一骑绝尘,并且是唯一一家在所有7个项目中都提交了成绩的厂商 。
本轮测试的一个重大看点,是MLCommons引入了两个全新的混合专家模型(MoE)预训练基准,这标志着AI基准测试正紧跟产业前沿趋势 。
NVIDIA是唯一一个在这两项新基准上都提交了成绩的平台。 他们使用GB300 NVL72系统,通过定制的软件堆栈、CUDA图(CUDA Graphs)和先进的MoE路由策略,树立了全新的性能标杆 。
云服务提供商CoreWeave在本轮测试中打出了最响亮的一枪。
这一纪录并非单纯堆砌硬件的结果,而是通过从网络、资源调度到存储的全栈深度优化才得以实现 。
本轮测试清晰展示了NVIDIA最新的Blackwell Ultra平台(GB300 NVL72)相较于上一代Blackwell(GB200 NVL72)的巨大进步。
本轮MLPerf Training v6.0不仅见证了性能的飞跃,也反映了整个行业的蓬勃发展。
要驯服拥有6710亿参数的DeepSeek-V3这类MoE巨兽,单靠强大的GPU是不够的,卓越的网络和系统级设计至关重要。
MLPerf Training v6.0的结果有力地证明,在AI训练这个领域,极致的系统设计与软硬件协同优化,正成为推动大模型技术民主化和应用落地的核心引擎。
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
NVIDIA在MLPerf Training v6.0中大获全胜,凭借Blackwell平台成为唯一提交全部7项测试的厂商,并包揽所有项目的冠军 [3]。
NVIDIA在MLPerf Training v6.0中大获全胜,凭借Blackwell平台成为唯一提交全部7项测试的厂商,并包揽所有项目的冠军 [3]。 MLCommons首次引入了两个全新的混合专家(MoE)模型预训练基准:DeepSeek V3(总参数6710亿,单Token激活370亿)和GPT OSS 20B,NVIDIA是唯一在这两个新基准上都提交了成绩的平台 [3][10]。
CoreWeave在8192颗NVIDIA GB300 NVL72 GPU的生产级云基础设施上,以2.02分钟完成了DeepSeek V3 671B的训练,创造了该基准测试的最快纪录 [8][26]。
Loading comments...
Comments
0 comments