NVIDIA, MLPerf Training v6.0'da yer alan 7 testin tamamında en hızlı eğitim süresini ve en yüksek hızlandırıcı başına performansı elde ederek tüm rakiplerini geride bıraktı. MLCommons, DeepSeek V3 (671 milyar parametre) ve GPT OSS 20B modellerini içeren iki yeni Mixture of Experts (Uzmanların Karışımı) ön eğitim tes...

Create a landscape editorial hero image for this Studio Global article: What are the key highlights from the MLPerf Training v6.0 results, including Nvidia's performance across all benchmarks on its Blackwell pla. Article summary: ## MLPerf Training v6.0 Key Highlights. Topic tags: general, documentation, news, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "Home » News » NVIDIA Sets MLPerf Inference v6.0 Records with Blackwell Ultra Platform. # NVIDIA Sets MLPerf Inference v6.0 Records with Blackwell Ultra Platform. NVIDIA has publish" source context "NVIDIA Sets MLPerf Inference v6.0 Records with Blackwell Ultra Platform - StorageReview.com" Reference image 2: visual subject "# MLPerf Inference v6.0 Results Explained: GPU Performance Rankings for AI Workloads (2026). MLPerf Inference v6.0 results dropped April 1, 2026, and
Yapay zeka donanım ve yazılımlarının performansını karşılaştıran en saygın ölçütlerden biri olan MLPerf Training 6.0 sonuçları açıklandı. NVIDIA, bu yılki testlerin mutlak galibi oldu. Şirket, ölçekli eğitimde en hızlı süre ve hızlandırıcı başına en yüksek performans olmak üzere tüm yedi iş yükünde birinciliği kaptı. Dahası, NVIDIA bu testlerin hepsine katılan tek platform oldu .
Bu başarının arkasında, yeni nesil Blackwell Ultra (GB300 NVL72) mimarisi ve bu donanım için özel olarak optimize edilmiş yazılım yığınları yatıyor. Özellikle CUDA grafikleri ve gelişmiş MoE (Uzmanların Karışımı) yönlendirme teknikleri, performansı zirveye taşıyan unsurlar arasında .
MLCommons konsorsiyumu bu yıl, yapay zeka dünyasının en popüler ve karmaşık mimarilerinden biri olan Uzmanların Karışımı (Mixture of Experts - MoE) tabanlı iki yeni ön eğitim testini devreye aldı . Bu testler şunlardı:
NVIDIA, bu iki yeni ve zorlu testte sonuç göndermeyi başaran tek platform oldu. Bu başarının ardında, 72 adet NVIDIA Blackwell Ultra GPU'yu birbirine bağlayan GB300 NVL72 sisteminin ham gücü ve NVIDIA'nın özelleştirilmiş yazılım yığınlarının (CUDA grafikleri, MoE yönlendirme optimize ediciler) uyumu yatıyor .
Cloud tabanlı GPU hizmeti sunan CoreWeave, MLPerf'in en zorlu iş yükü olarak görülen DeepSeek-V3 (671B) modelinin eğitiminde adeta çağ atladı. Şirket, 2.048 düğüm üzerinde toplam 8.192 adet NVIDIA GB300 NVL72 GPU kullanarak, bu dev modeli yalnızca 2.02 dakikada eğitti .
Bu sonuç, testteki en büyük GB300 kümesiyle elde edildi ve en hızlı DeepSeek-V3 eğitim süresi olarak kayıtlara geçti. CoreWeave, bu başarıyı sadece GPU sayısına değil; ağ iletişimi, veri düzenleme ve depolama katmanlarını kapsayan uçtan uca altyapı optimizasyonlarına borçlu . Şirketin aynı testte 4.096 GPU ile 3.09 dakika, 2.048 GPU ile 5.54 dakika gibi çarpıcı sonuçlara da imza attığını belirtelim
.
Peki, bu nesil sıçraması ne kadar büyük? Rakamlar her şeyi anlatıyor. Yeni Blackwell Ultra (GB300 NVL72) platformu, bir önceki nesil GB200 NVL72 ile kıyaslandığında:
Bu performans sıçraması iki temele dayanıyor: Donanım ve yazılım. Donanım tarafında, GB300 NVL72'nin daha büyük bellek ve güç bütçesi, daha yüksek model lokalitesi ve veri işleme kapasitesi sunuyor . Yazılım tarafında ise NVIDIA'nın sürekli iyileştirdiği yığınlar devreye giriyor. Örneğin, DeepSeek-V3 eğitim verimi, aynı donanım üzerinde sadece üç ayda 1.3 kat arttı. Bu, "tam iterasyon CUDA grafikleri" ve "CuTe DSL füzyonları" gibi yazılımsal yeniliklerle mümkün oldu
.
MLPerf Training 6.0, sadece NVIDIA'nın zaferiyle değil, aynı zamanda rekor katılımla da gündeme geldi. Toplam 24 farklı kuruluş, 95 ayrı sistemde ve 13 farklı donanım hızlandırıcı kullanarak sonuçlarını sundu . Bu katılımcılar arasında Microsoft Azure, Google, Oracle gibi bulut devleri; Dell, HPE, Cisco gibi sunucu üreticileri ve AMD gibi rakip çip üreticileri yer aldı
.
Öne çıkan rekabet hamlelerinden biri AMD'den geldi. AMD'nin Instinct MI355X hızlandırıcıları, MXFP4 (Mikro Ölçekli Kayan Nokta 4-bit) hassasiyetini kullanarak, NVIDIA B200 platformunun NVFP4 hassasiyetli sonuçlarına ciddi şekilde yaklaştı. Llama 2-70B ince ayar testinde aradaki fark %5'e, Llama 3.1-8B ön eğitim testinde ise %6'ya kadar indi . Bu, veri merkezi GPU'ları pazarındaki rekabetin giderek kızıştığının en net göstergelerinden biri oldu.
Binlerce GPU'yu tek bir yapay zeka süper bilgisayarına dönüştürmek, yalnızca çipleri bir araya getirmekten ibaret değil. Buradaki sihirli değnek, ağ teknolojilerinde yatıyor. NVIDIA ve ortakları, testlerde 8.192 Blackwell GPU'ya kadar ölçeklendi. Bu devasa kümelerde, özellikle MoE modellerinin yoğun ve patlamalı (bursty) tümden-tüme iletişim desenleri için NVIDIA'nın Spectrum-X Ethernet çözümü kritik rol oynadı .
Spectrum-X'in Adaptif Yönlendirme (Adaptive Routing) ve Tıkanıklık Kontrolü (Congestion Control) özellikleri, ağ dokusunun teorik bant genişliğine yakın bir performansla çalışmasını sağladı. NVLink anahtar alanları ile ölçeklenebilir ağ dokusunun bu birleşimi, diğer tüm testlerdeki rekor sürelerin de anahtarı oldu :
Bu sonuçlar, yapay zeka eğitiminin artık saatler veya günlerle değil, dakikalarla ifade edilen bir hıza ulaştığını ve büyük ölçekli altyapıların bu hızı mümkün kıldığını kanıtlıyor.
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
NVIDIA, MLPerf Training v6.0'da yer alan 7 testin tamamında en hızlı eğitim süresini ve en yüksek hızlandırıcı başına performansı elde ederek tüm rakiplerini geride bıraktı.
NVIDIA, MLPerf Training v6.0'da yer alan 7 testin tamamında en hızlı eğitim süresini ve en yüksek hızlandırıcı başına performansı elde ederek tüm rakiplerini geride bıraktı. MLCommons, DeepSeek V3 (671 milyar parametre) ve GPT OSS 20B modellerini içeren iki yeni Mixture of Experts (Uzmanların Karışımı) ön eğitim testini duyurdu.
CoreWeave, DeepSeek V3'ün en zorlu sürümünü 8.192 adet NVIDIA GB300 NVL72 GPU kullanarak yalnızca 2.02 dakikada eğiterek yeni bir dünya rekoru kırdı.
Loading comments...
Comments
0 comments