What should I do next in practice?

CoreWeave, DeepSeek V3'ün en zorlu sürümünü 8.192 adet NVIDIA GB300 NVL72 GPU kullanarak yalnızca 2.02 dakikada eğiterek yeni bir dünya rekoru kırdı.

studioglobal

← Back to Trending

AnswersPublished2 weeks agoLast edited 2 weeks ago21 sources

NVIDIA, MLPerf Training 6.0'da Ezici Bir Üstünlük Kurdu: İşte Rekor Sonuçların Perde Arkası

NVIDIA, MLPerf Training v6.0'da yer alan 7 testin tamamında en hızlı eğitim süresini ve en yüksek hızlandırıcı başına performansı elde ederek tüm rakiplerini geride bıraktı. MLCommons, DeepSeek V3 (671 milyar parametre) ve GPT OSS 20B modellerini içeren iki yeni Mixture of Experts (Uzmanların Karışımı) ön eğitim tes...

Search & fact-check with Studio Global AI Browse more Trending pages

509K0

NVIDIA Blackwell Ultra GPUs powering record-breaking MLPerf Training v6.0 results for massive AI models. — What are the key highlights from the MLPerf Training v6.0 results, including Nvidia's performance across all benchmarks on its Blackwell plaNVIDIA's Blackwell platform set new performance records across all MLPerf Training v6.0 benchmarks, driven by the powerful GB300 NVL72 system.
AI Prompt
Create a landscape editorial hero image for this Studio Global article: What are the key highlights from the MLPerf Training v6.0 results, including Nvidia's performance across all benchmarks on its Blackwell pla. Article summary: ## MLPerf Training v6.0 Key Highlights. Topic tags: general, documentation, news, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "Home » News » NVIDIA Sets MLPerf Inference v6.0 Records with Blackwell Ultra Platform. # NVIDIA Sets MLPerf Inference v6.0 Records with Blackwell Ultra Platform. NVIDIA has publish" source context "NVIDIA Sets MLPerf Inference v6.0 Records with Blackwell Ultra Platform - StorageReview.com" Reference image 2: visual subject "# MLPerf Inference v6.0 Results Explained: GPU Performance Rankings for AI Workloads (2026). MLPerf Inference v6.0 results dropped April 1, 2026, and
openai.com

NVIDIA'dan Tam Hakimiyet: Tüm Testlerde Birincilik

Yapay zeka donanım ve yazılımlarının performansını karşılaştıran en saygın ölçütlerden biri olan MLPerf Training 6.0 sonuçları açıklandı. NVIDIA, bu yılki testlerin mutlak galibi oldu. Şirket, ölçekli eğitimde en hızlı süre ve hızlandırıcı başına en yüksek performans olmak üzere tüm yedi iş yükünde birinciliği kaptı. Dahası, NVIDIA bu testlerin hepsine katılan tek platform oldu .

Bu başarının arkasında, yeni nesil Blackwell Ultra (GB300 NVL72) mimarisi ve bu donanım için özel olarak optimize edilmiş yazılım yığınları yatıyor. Özellikle CUDA grafikleri ve gelişmiş MoE (Uzmanların Karışımı) yönlendirme teknikleri, performansı zirveye taşıyan unsurlar arasında .

Yeni Nesil Modeller Testlere Dahil Oldu: DeepSeek-V3 ve GPT-OSS-20B

MLCommons konsorsiyumu bu yıl, yapay zeka dünyasının en popüler ve karmaşık mimarilerinden biri olan Uzmanların Karışımı (Mixture of Experts - MoE) tabanlı iki yeni ön eğitim testini devreye aldı . Bu testler şunlardı:

DeepSeek-V3 (671 milyar toplam parametre, token başına 37 milyar aktif parametre): Devasa ölçeğiyle öne çıkan, Çin merkezli DeepSeek firmasının son teknoloji ürünü. Model; Çok Başlıklı Gizli Dikkat (MLA), ince taneli uzman segmentasyonu ve çoklu token tahmini gibi gelişmiş özellikler barındırıyor .
GPT-OSS-20B (20 milyar parametre): MoE mimarisinin daha küçük ölçekli, ancak bir o kadar da yaygın kullanıma uygun bir temsilcisi.

NVIDIA, bu iki yeni ve zorlu testte sonuç göndermeyi başaran tek platform oldu. Bu başarının ardında, 72 adet NVIDIA Blackwell Ultra GPU'yu birbirine bağlayan GB300 NVL72 sisteminin ham gücü ve NVIDIA'nın özelleştirilmiş yazılım yığınlarının (CUDA grafikleri, MoE yönlendirme optimize ediciler) uyumu yatıyor .

CoreWeave'den DeepSeek-V3 Rekoru: 2.02 Dakikada Eğitim

Cloud tabanlı GPU hizmeti sunan CoreWeave, MLPerf'in en zorlu iş yükü olarak görülen DeepSeek-V3 (671B) modelinin eğitiminde adeta çağ atladı. Şirket, 2.048 düğüm üzerinde toplam 8.192 adet NVIDIA GB300 NVL72 GPU kullanarak, bu dev modeli yalnızca 2.02 dakikada eğitti .

Bu sonuç, testteki en büyük GB300 kümesiyle elde edildi ve en hızlı DeepSeek-V3 eğitim süresi olarak kayıtlara geçti. CoreWeave, bu başarıyı sadece GPU sayısına değil; ağ iletişimi, veri düzenleme ve depolama katmanlarını kapsayan uçtan uca altyapı optimizasyonlarına borçlu . Şirketin aynı testte 4.096 GPU ile 3.09 dakika, 2.048 GPU ile 5.54 dakika gibi çarpıcı sonuçlara da imza attığını belirtelim .

NVIDIA GB300 NVL72 vs. GB200 NVL72: Yeni Neslin Getirdiği Sıçrama

Peki, bu nesil sıçraması ne kadar büyük? Rakamlar her şeyi anlatıyor. Yeni Blackwell Ultra (GB300 NVL72) platformu, bir önceki nesil GB200 NVL72 ile kıyaslandığında:

Çıkarım (inference) tarafında saniye başına token üretiminde 2.77 kata kadar hız artışı sağlıyor .
Aynı ölçekteki eğitim iş yüklerinde, GB200 NVL72'den 1.6 kata kadar daha hızlı sonuçlar veriyor .

Bu performans sıçraması iki temele dayanıyor: Donanım ve yazılım. Donanım tarafında, GB300 NVL72'nin daha büyük bellek ve güç bütçesi, daha yüksek model lokalitesi ve veri işleme kapasitesi sunuyor . Yazılım tarafında ise NVIDIA'nın sürekli iyileştirdiği yığınlar devreye giriyor. Örneğin, DeepSeek-V3 eğitim verimi, aynı donanım üzerinde sadece üç ayda 1.3 kat arttı. Bu, "tam iterasyon CUDA grafikleri" ve "CuTe DSL füzyonları" gibi yazılımsal yeniliklerle mümkün oldu .

Rekor Katılım, Büyüyen Rekabet

MLPerf Training 6.0, sadece NVIDIA'nın zaferiyle değil, aynı zamanda rekor katılımla da gündeme geldi. Toplam 24 farklı kuruluş, 95 ayrı sistemde ve 13 farklı donanım hızlandırıcı kullanarak sonuçlarını sundu . Bu katılımcılar arasında Microsoft Azure, Google, Oracle gibi bulut devleri; Dell, HPE, Cisco gibi sunucu üreticileri ve AMD gibi rakip çip üreticileri yer aldı .

Öne çıkan rekabet hamlelerinden biri AMD'den geldi. AMD'nin Instinct MI355X hızlandırıcıları, MXFP4 (Mikro Ölçekli Kayan Nokta 4-bit) hassasiyetini kullanarak, NVIDIA B200 platformunun NVFP4 hassasiyetli sonuçlarına ciddi şekilde yaklaştı. Llama 2-70B ince ayar testinde aradaki fark %5'e, Llama 3.1-8B ön eğitim testinde ise %6'ya kadar indi . Bu, veri merkezi GPU'ları pazarındaki rekabetin giderek kızıştığının en net göstergelerinden biri oldu.

Ölçeklenebilirliğin Sırrı: Ağ ve Sistem Mimarisi

Binlerce GPU'yu tek bir yapay zeka süper bilgisayarına dönüştürmek, yalnızca çipleri bir araya getirmekten ibaret değil. Buradaki sihirli değnek, ağ teknolojilerinde yatıyor. NVIDIA ve ortakları, testlerde 8.192 Blackwell GPU'ya kadar ölçeklendi. Bu devasa kümelerde, özellikle MoE modellerinin yoğun ve patlamalı (bursty) tümden-tüme iletişim desenleri için NVIDIA'nın Spectrum-X Ethernet çözümü kritik rol oynadı .

Spectrum-X'in Adaptif Yönlendirme (Adaptive Routing) ve Tıkanıklık Kontrolü (Congestion Control) özellikleri, ağ dokusunun teorik bant genişliğine yakın bir performansla çalışmasını sağladı. NVLink anahtar alanları ile ölçeklenebilir ağ dokusunun bu birleşimi, diğer tüm testlerdeki rekor sürelerin de anahtarı oldu :

Llama 3.1 8B Ön Eğitimi: 5.2 dakika
Llama 2 70B İnce Ayar (LoRA): 0.40 dakika (24 saniye!)
FLUX.1 Görüntü Üretimi: 12.5 dakika
DLRM-DCNv2 (Önerici Sistem): 0.71 dakika
RetinaNet (Nesne Tespiti): 1.4 dakika

Bu sonuçlar, yapay zeka eğitiminin artık saatler veya günlerle değil, dakikalarla ifade edilen bir hıza ulaştığını ve büyük ölçekli altyapıların bu hızı mümkün kıldığını kanıtlıyor.

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Search & fact-check with Studio Global AI

Sources

Comments

0 comments

Loading comments...

← Back to Trending

AnswersPublished2 weeks agoLast edited 2 weeks ago21 sources

NVIDIA, MLPerf Training 6.0'da Ezici Bir Üstünlük Kurdu: İşte Rekor Sonuçların Perde Arkası

Search & fact-check with Studio Global AI Browse more Trending pages

509K0

NVIDIA'dan Tam Hakimiyet: Tüm Testlerde Birincilik

Yeni Nesil Modeller Testlere Dahil Oldu: DeepSeek-V3 ve GPT-OSS-20B

DeepSeek-V3 (671 milyar toplam parametre, token başına 37 milyar aktif parametre): Devasa ölçeğiyle öne çıkan, Çin merkezli DeepSeek firmasının son teknoloji ürünü. Model; Çok Başlıklı Gizli Dikkat (MLA), ince taneli uzman segmentasyonu ve çoklu token tahmini gibi gelişmiş özellikler barındırıyor .
GPT-OSS-20B (20 milyar parametre): MoE mimarisinin daha küçük ölçekli, ancak bir o kadar da yaygın kullanıma uygun bir temsilcisi.

CoreWeave'den DeepSeek-V3 Rekoru: 2.02 Dakikada Eğitim

NVIDIA GB300 NVL72 vs. GB200 NVL72: Yeni Neslin Getirdiği Sıçrama

Peki, bu nesil sıçraması ne kadar büyük? Rakamlar her şeyi anlatıyor. Yeni Blackwell Ultra (GB300 NVL72) platformu, bir önceki nesil GB200 NVL72 ile kıyaslandığında:

Çıkarım (inference) tarafında saniye başına token üretiminde 2.77 kata kadar hız artışı sağlıyor .
Aynı ölçekteki eğitim iş yüklerinde, GB200 NVL72'den 1.6 kata kadar daha hızlı sonuçlar veriyor .

Rekor Katılım, Büyüyen Rekabet

Ölçeklenebilirliğin Sırrı: Ağ ve Sistem Mimarisi

Llama 3.1 8B Ön Eğitimi: 5.2 dakika
Llama 2 70B İnce Ayar (LoRA): 0.40 dakika (24 saniye!)
FLUX.1 Görüntü Üretimi: 12.5 dakika
DLRM-DCNv2 (Önerici Sistem): 0.71 dakika
RetinaNet (Nesne Tespiti): 1.4 dakika

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

NVIDIA, MLPerf Training 6.0'da Ezici Bir Üstünlük Kurdu: İşte Rekor Sonuçların Perde Arkası

NVIDIA'dan Tam Hakimiyet: Tüm Testlerde Birincilik

Yeni Nesil Modeller Testlere Dahil Oldu: DeepSeek-V3 ve GPT-OSS-20B

CoreWeave'den DeepSeek-V3 Rekoru: 2.02 Dakikada Eğitim

NVIDIA GB300 NVL72 vs. GB200 NVL72: Yeni Neslin Getirdiği Sıçrama

Rekor Katılım, Büyüyen Rekabet

Ölçeklenebilirliğin Sırrı: Ağ ve Sistem Mimarisi

Search, cite, and publish your own answer

People also ask

What is the short answer to "NVIDIA, MLPerf Training 6.0'da Ezici Bir Üstünlük Kurdu: İşte Rekor Sonuçların Perde Arkası"?

What are the key points to validate first?

What should I do next in practice?

Sources

Comments

NVIDIA, MLPerf Training 6.0'da Ezici Bir Üstünlük Kurdu: İşte Rekor Sonuçların Perde Arkası

NVIDIA'dan Tam Hakimiyet: Tüm Testlerde Birincilik

Yeni Nesil Modeller Testlere Dahil Oldu: DeepSeek-V3 ve GPT-OSS-20B

CoreWeave'den DeepSeek-V3 Rekoru: 2.02 Dakikada Eğitim

NVIDIA GB300 NVL72 vs. GB200 NVL72: Yeni Neslin Getirdiği Sıçrama

Rekor Katılım, Büyüyen Rekabet

Ölçeklenebilirliğin Sırrı: Ağ ve Sistem Mimarisi

Search, cite, and publish your own answer

People also ask

What is the short answer to "NVIDIA, MLPerf Training 6.0'da Ezici Bir Üstünlük Kurdu: İşte Rekor Sonuçların Perde Arkası"?

What are the key points to validate first?

What should I do next in practice?

Sources

Comments