Strategi ini juga mengikuti tren industri yang lebih luas: hyperscaler seperti Amazon dan Google mulai merancang silicon mereka sendiri untuk AI.
Salah satu indikator paling jelas bahwa Trainium mulai diterima pasar adalah besarnya komitmen jangka panjang dari pelanggan.
AWS telah mengumumkan beberapa kesepakatan komputasi multi‑tahun dan multi‑gigawatt yang menggunakan infrastruktur Trainium.
Beberapa contoh penting:
Anthropic
Perusahaan AI ini berencana menghabiskan lebih dari $100 miliar selama 10 tahun untuk teknologi AWS, termasuk kapasitas Trainium besar untuk melatih dan menjalankan model Claude.
OpenAI
AWS memperoleh komitmen sekitar dua gigawatt kapasitas komputasi Trainium sebagai bagian dari kemitraan infrastrukturnya dengan perusahaan tersebut.
Uber
Perusahaan ride‑hailing ini memperluas kontrak AWS dan mulai menguji pelatihan model AI menggunakan Trainium3, selain menjalankan sistem produksi pada prosesor Graviton milik Amazon.
Yang penting dari kesepakatan ini adalah bahwa adopsi datang dari dua kategori sekaligus:
Bukan hanya dari kebutuhan internal Amazon.
Meski begitu, Nvidia masih mendominasi pasar hardware AI. Perkiraan menunjukkan perusahaan ini menguasai sekitar 81% pasar chip AI data center, berkat GPU yang sangat kuat dan ekosistem software CUDA yang matang.
Namun ada beberapa faktor struktural yang membuat perusahaan mulai mendiversifikasi infrastruktur mereka.
1. Keterbatasan pasokan
Pelatihan model AI modern membutuhkan ribuan hingga puluhan ribu akselerator. Ketergantungan pada satu vendor bisa menjadi hambatan saat permintaan melonjak.
2. Tekanan biaya
Komputasi kini menjadi salah satu biaya terbesar dalam pengembangan AI. Chip khusus yang dioptimalkan untuk workload tertentu berpotensi menurunkan total biaya pelatihan.
3. Integrasi vertikal oleh penyedia cloud
Dengan membangun chip sendiri, perusahaan seperti Amazon bisa mengontrol harga, pasokan hardware, serta optimasi sistem di pusat data mereka.
Dalam praktiknya, kebanyakan perusahaan tidak meninggalkan Nvidia sepenuhnya. Mereka hanya mengadopsi strategi multi‑vendor, menggabungkan GPU dengan chip khusus seperti Trainium atau TPU milik Google.
Generasi terbaru dari arsitektur ini adalah Trainium3, yang dirancang untuk meningkatkan performa dan efisiensi energi.
AWS juga mengatakan beberapa pelanggan berhasil mencapai hingga 50% pengurangan biaya pelatihan dan inferensi menggunakan sistem berbasis Trainium, meskipun hasilnya bergantung pada jenis model dan optimasi software.
Selain itu, Amazon menyatakan:
Meski demikian, benchmark independen lintas workload masih terbatas, dan Nvidia masih unggul dalam ekosistem developer serta tooling.
Pasar hardware AI kini semakin jelas terbagi ke dalam tiga pendekatan utama.
Nvidia
Pemasok dominan GPU AI, dengan hardware kuat untuk pelatihan model frontier serta ekosistem software yang sangat matang.
Google
Pelopor chip AI khusus dengan TPU (Tensor Processing Unit) yang digunakan secara luas di infrastruktur Google dan semakin ditawarkan kepada pelanggan cloud.
Amazon
AWS membangun stack komputasi terintegrasi yang mencakup:
Alih‑alih hanya bersaing pada kekuatan chip semata, strategi Amazon berfokus pada integrasi penuh antara hardware, layanan cloud, dan kontrak infrastruktur jangka panjang.
Chip Trainium mulai mendapatkan momentum karena AWS berhasil mengubah custom silicon menjadi platform infrastruktur AI berskala besar.
Komitmen komputasi raksasa dari perusahaan seperti Anthropic dan OpenAI, adopsi perusahaan seperti Uber, serta peningkatan performa generasi terbaru membuat Trainium menjadi alternatif yang semakin kredibel untuk workload AI skala besar.
Meski demikian, Nvidia masih menjadi pemain dominan di pasar hardware AI. Keunggulan ekosistem software dan basis developer mereka masih sangat besar.
Namun munculnya chip AI dari hyperscaler seperti Amazon dan Google menunjukkan satu hal penting: masa depan infrastruktur AI kemungkinan tidak akan bergantung pada satu vendor saja, melainkan pada beberapa arsitektur hardware yang berjalan berdampingan.
Comments
0 comments