Logikanya sederhana: selama ini Nvidia mendominasi GPU untuk pelatihan dan inferensi AI, sementara CPU server di pusat data biasanya dipasok oleh Intel atau AMD.
Dengan menghadirkan CPU sendiri, Nvidia kini dapat menjual lapisan CPU sekaligus GPU dalam infrastruktur AI.
Perusahaan juga mempromosikan konsep "AI factories", yaitu pusat data besar yang secara terus‑menerus menghasilkan output AI—mulai dari chatbot hingga agen otomatis. Dalam sistem ini, GPU melakukan komputasi numerik berat, sementara CPU mengatur seluruh lingkungan perangkat lunak di sekitarnya.
Perlu dicatat: angka $200 miliar merupakan estimasi strategis Nvidia sendiri, bukan proyeksi pasar independen dari lembaga riset.
CPU cloud tradisional dirancang untuk beban kerja seperti layanan web, basis data, atau virtualisasi. Nvidia berpendapat bahwa AI agen bekerja dengan cara berbeda.
Alih‑alih hanya menjalankan model sekali, agen AI biasanya melakukan banyak langkah dalam satu tugas, misalnya:
Sebagian besar proses tersebut terjadi di luar jaringan saraf AI, tetapi tetap harus berjalan sangat cepat agar GPU tidak menganggur. Vera dirancang khusus untuk lapisan orkestrasi ini.
Nvidia mengatakan CPU tersebut dibuat khusus untuk reinforcement learning dan lingkungan agentic AI, dengan klaim kinerja sekitar dua kali lebih efisien dan hingga 50% lebih cepat dibanding CPU rack‑scale tradisional pada skenario target.
Secara arsitektur, Vera menggunakan 88 inti CPU “Olympus” yang kompatibel dengan Arm, dengan bandwidth memori tinggi untuk menangani sistem AI berskala besar.
CPU Vera tidak dimaksudkan menggantikan GPU. Perannya adalah mengontrol dan mengoordinasikan pekerjaan GPU di pusat data AI.
Dalam platform generasi berikutnya bernama Vera Rubin, Nvidia menggabungkan beberapa jenis chip menjadi satu sistem terpadu, termasuk:
Salah satu contohnya adalah rak server Vera Rubin NVL72, yang menggabungkan 72 GPU Rubin dan 36 CPU Vera yang terhubung dengan jaringan NVLink berbandwidth tinggi.
Dalam sistem tersebut, CPU bertugas untuk:
Argumen utama Nvidia adalah bahwa cara kerja aplikasi AI sedang berubah.
Model generatif awal biasanya hanya menerima prompt lalu menghasilkan jawaban. Namun sistem berbasis agen melakukan proses multi‑langkah yang kompleks, termasuk memanggil model berulang kali selama satu tugas.
Beberapa analis bahkan memperkirakan kebutuhan komputasi untuk agentic AI bisa berkali‑kali lipat lebih besar dibanding AI generatif sebelumnya, karena agen terus berinteraksi dengan model, alat, dan database.
Dalam konteks ini, CPU menjadi semacam “control plane” untuk infrastruktur AI—mengatur penjadwalan tugas, input‑output, eksekusi kode, dan koordinasi ribuan operasi GPU.
Jika suatu saat miliaran agen AI berjalan secara terus‑menerus di layanan cloud, lapisan CPU dapat menjadi bagian besar dari pasar perangkat keras AI.
Masuknya Vera juga menandai ambisi Nvidia untuk bersaing langsung di pasar CPU server.
Selama bertahun‑tahun, Intel dan AMD mendominasi CPU pusat data, sementara penyedia cloud besar seperti AWS dan Google mulai merancang chip mereka sendiri.
Pendekatan Nvidia berbeda. Alih‑alih hanya menjual chip terpisah, perusahaan ini mencoba membangun sistem AI lengkap dari ujung ke ujung.
Dalam arsitektur Vera Rubin, CPU, GPU, jaringan, dan perangkat lunak dirancang bersama agar bekerja sebagai satu platform komputasi yang dioptimalkan untuk AI.
Nvidia berpendapat pendekatan ini dapat menghasilkan biaya per token AI lebih rendah dan performa lebih tinggi untuk layanan AI skala besar.
Namun keberhasilan strategi tersebut belum pasti. Perusahaan cloud memiliki insentif kuat untuk mengembangkan silikon mereka sendiri agar tidak terlalu bergantung pada Nvidia.
Tetapi Nvidia bertaruh bahwa infrastruktur AI yang terintegrasi secara vertikal—mulai dari GPU, CPU, jaringan hingga software—akan sulit ditiru dengan cepat oleh pesaing.
CPU Vera menandai perubahan strategi yang lebih luas di Nvidia.
Alih‑alih hanya menjadi produsen GPU, perusahaan ini semakin memposisikan diri sebagai penyedia infrastruktur AI lengkap—mulai dari komputasi, jaringan, hingga sistem pusat data skala rak.
Jika visi Huang tentang masa depan AI agen otonom terbukti benar, maka CPU seperti Vera bisa menjadi komponen kunci dalam ekosistem tersebut—mengubah pasar yang dulu berpusat pada GPU menjadi peluang infrastruktur AI yang jauh lebih besar.
Comments
0 comments