Jika server Azure berbasis Maia nantinya digunakan untuk menjalankan model Claude—terutama untuk inference—hal itu akan menunjukkan bahwa chip Microsoft mampu digunakan pada skala produksi nyata, bukan sekadar eksperimen internal.
Microsoft memperkenalkan Maia 200 sebagai akselerator AI generasi kedua yang dioptimalkan untuk inference. Dalam dunia AI, inference adalah proses menjalankan model yang sudah dilatih untuk menghasilkan jawaban atau konten—dan biaya operasionalnya kini menjadi salah satu komponen terbesar dalam layanan AI.
Beberapa spesifikasi penting dari Maia 200 meliputi:
Microsoft menyatakan bahwa desain chip ini berfokus pada pengurangan biaya per token yang dihasilkan oleh model bahasa besar. Perusahaan juga mengklaim Maia 200 memberikan sekitar 30% peningkatan performa per dolar dibanding generasi perangkat keras sebelumnya di infrastrukturnya.
Bagi layanan AI skala besar—di mana jutaan permintaan pengguna diproses setiap hari—efisiensi semacam ini bisa berdampak langsung pada biaya operasional.
Kemitraan antara kedua perusahaan sudah melibatkan investasi dan komitmen komputasi dalam skala sangat besar. Kesepakatan 2025 mengikat Anthropic untuk memperluas model Claude di Azure serta menggunakan arsitektur Nvidia untuk banyak beban kerja AI.
Jika Maia ikut digunakan, kemungkinan besar chip ini tidak menggantikan GPU Nvidia, melainkan melengkapi infrastruktur yang ada.
GPU Nvidia masih sangat dominan dalam pelatihan model AI berskala besar. Namun untuk inference—yang lebih menekankan efisiensi biaya dan throughput—chip khusus seperti Maia sering kali bisa memberikan ekonomi yang lebih baik.
Diskusi ini juga mencerminkan perubahan besar di industri AI.
Perusahaan pembuat model kini semakin sering menjalankan workload di berbagai cloud dan berbagai jenis chip. Alih‑alih bergantung pada satu vendor hardware, mereka mencampur berbagai infrastruktur untuk mendapatkan kombinasi terbaik antara harga, ketersediaan, dan performa.
Strategi ini memberikan beberapa keuntungan:
Sebagai respons, perusahaan cloud besar mulai merancang chip mereka sendiri. Google memiliki TPU, Amazon mengembangkan Trainium dan Inferentia, sementara Microsoft mengembangkan Maia—semuanya bertujuan mengurangi ketergantungan pada chip pihak ketiga dan menguasai lebih banyak bagian dari rantai nilai AI.
Jika Anthropic akhirnya menggunakan Maia 200 dalam skala besar, itu akan menjadi sinyal kuat bagi industri cloud: chip yang dirancang oleh hyperscaler kini mulai menjadi alternatif serius untuk menjalankan AI.
Nvidia masih menjadi pemain dominan dalam komputasi AI global. Namun perusahaan cloud terbesar kini membangun ekosistem terintegrasi—mulai dari chip, pusat data, hingga platform AI—untuk menangkap lebih banyak nilai dari ledakan industri AI.
Dalam konteks itu, deployment Claude di Azure dengan chip Maia bukan sekadar kontrak infrastruktur biasa. Ini bisa menjadi tanda bahwa perlombaan chip AI telah memasuki babak baru, di mana penyedia cloud tidak hanya bersaing di layanan dan software, tetapi juga pada silikon yang menjalankan AI itu sendiri.
Comments
0 comments