Pendekatan modular ini memungkinkan setiap rak dioptimalkan untuk fungsi tertentu—pelatihan, inferensi, jaringan, atau penyimpanan—sambil beroperasi sebagai satu superkomputer logis.
Peningkatan produksi ini berskala global. Nvidia mengonfirmasi bahwa ratusan mitra ekosistem rantai pasok sedang memproduksi sistem Vera Rubin, dengan lebih dari 150 mitra di antaranya berlokasi di Taiwan saja . Produksi tersebar di lebih dari 350 pabrik di 30 negara, sinyal jelas bahwa Nvidia sedang bersiap untuk memenuhi permintaan volume besar dari lab AI, penyedia cloud, dan hyperscaler (perusahaan komputasi awan skala besar)
. Pembangun sistem (system builder) papan atas yang sudah dalam produksi skala penuh meliputi Dell Technologies, HPE, Lenovo, dan Supermicro
.
Sehari setelah keynote GTC Taipei, CoreWeave mengumumkan telah menyelesaikan uji coba (bring-up) dan validasi pertama di industri untuk sistem Vera Rubin NVL72 di CoreWeave Cloud . Pengumuman tersebut mengonfirmasi bahwa rak ini menghasilkan inferensi per watt hingga 10 kali lebih baik dibandingkan generasi sebelumnya, serta pengurangan jumlah GPU yang dibutuhkan untuk beban kerja skala besar
. Kecepatan CoreWeave dalam menyiapkan sistem yang beroperasi penuh menegaskan kemitraan rekayasa mendalamnya dengan Nvidia dan memposisikannya sebagai penyedia akses awal terkemuka untuk generasi Rubin.
CPU Vera adalah pembeda utama untuk platform ini. Digambarkan sebagai CPU pusat data mandiri pertama Nvidia, chip ini memasuki produksi massal dengan pengiriman diharapkan dimulai pada kuartal ketiga 2026 . Nvidia telah merancang chip ini secara khusus untuk tuntutan AI agen otonom, yang membutuhkan pemrosesan data tinggi (throughput) dan latensi rendah di kumpulan memori yang sangat besar. Pelanggan awal yang telah dikonfirmasi untuk CPU Vera termasuk OpenAI, Anthropic, dan SpaceX
.
Peralihan ke produksi penuh untuk Vera Rubin menandakan transisi industri yang lebih luas menuju infrastruktur yang dibangun khusus untuk AI agen otonom—sistem yang tidak hanya menghasilkan respons tetapi dapat bernalar, merencanakan, dan menjalankan tindakan multi-langkah yang kompleks. Dengan mengintegrasikan teknologi inferensi latensi rendah Groq langsung ke dalam arsitektur POD, Nvidia menargetkan kelas beban kerja baru di mana kecepatan dan efisiensi inferensi adalah yang terpenting .
Platform ini diperkirakan akan tersedia secara umum untuk penyedia cloud dan perusahaan pada paruh kedua tahun 2026, dengan AWS, Google Cloud, Microsoft Azure, dan Oracle Cloud Infrastructure disebut sebagai pengguna awal yang diharapkan . Mengingat Vera Rubin sudah diumumkan memasuki produksi di CES pada Januari dan lagi di GTC pada Maret, pembaruan GTC Taipei ini mengonfirmasi bahwa momentum peningkatan produksi tetap terjaga dan kini didukung oleh rantai pasok global yang berskala penuh
.
Comments
0 comments