| Google TPU v6e (Trillium) | AS / Google | Arsitektur TPU khusus | 918 TFLOPs bf16 per chip | 32GB HBM | ~1.6 TB/s | Tidak disebutkan | Dirancang untuk TPU Pod hingga 256 chip yang saling terhubung. |
| Huawei Ascend 910 | China / Huawei | Da Vinci architecture (~7nm) | ~256 TFLOPS FP16 | HBM | ~1.2 TB/s | ~350W | Diluncurkan 2019 sebagai akselerator AI flagship Huawei. |
| Huawei Ascend 910C | China / Huawei | Desain chiplet (dual‑die) | ~800 TFLOPS FP16 | hingga ~96–128GB HBM | ~3.2 TB/s | ~310W | Dirancang untuk bersaing dengan GPU AI kelas data center. |
| Biren BR100 | China / Biren | GPU dual‑die, TSMC 7nm CoWoS | 256 TFLOPS FP32 / ~2,048 TOPS INT8 | 64GB HBM2E | ~2.3 TB/s | ~550W | GPU chiplet besar dengan ~77 miliar transistor. |
| Biren BR104 | China / Biren | GPU single‑die | ~128 TFLOPS FP32 | 32GB HBM2E | ~819 GB/s | ~300W | Varian PCIe untuk akselerator pusat data. |
| Cambricon MLU370‑X8 | China / Cambricon | MLUarch03, 7nm | 96 TFLOPS FP16 / 256 TOPS INT8 | 48GB LPDDR5 | ~614 GB/s | ~250W | Interkoneksi MLU‑Link untuk klaster multi‑kartu. |
Akselerator AI dari AS saat ini masih memimpin dalam performa komputasi mentah yang terdokumentasi.
Sebagai contoh:
Di sisi China, beberapa desain terbaru mencoba memperkecil jarak tersebut.
Secara umum, performa chip AI modern sangat bergantung pada operasi matriks dan tensor yang digunakan dalam pelatihan model deep learning.
Model AI besar memindahkan data dalam jumlah sangat besar antara memori dan unit komputasi. Karena itu, HBM (High Bandwidth Memory) menjadi komponen penting dalam akselerator AI.
Beberapa contoh spesifikasi memori:
Bandwidth tinggi membantu mempercepat operasi tensor besar yang umum dalam pelatihan model AI modern.
Pelatihan model AI jarang dilakukan pada satu chip saja. Biasanya ratusan hingga ribuan akselerator dihubungkan dalam satu klaster komputasi besar.
Contohnya:
Dalam praktiknya, arsitektur klaster sering sama pentingnya dengan performa chip individu.
Teknologi fabrikasi semikonduktor berpengaruh besar terhadap efisiensi energi dan performa.
Beberapa chip AI China masih bergantung pada teknologi manufaktur eksternal. Misalnya:
Sementara itu, chip yang dirancang di AS biasanya memanfaatkan rantai pasok global dengan akses ke teknologi fabrikasi dan packaging paling mutakhir.
Performa hardware saja tidak cukup menentukan dominasi di komputasi AI.
Keunggulan besar perusahaan AS adalah ekosistem software yang matang, seperti:
Huawei mencoba membangun alternatif domestik melalui framework CANN (Compute Architecture for Neural Networks) untuk chip Ascend.
Bagi banyak perusahaan AI, dukungan framework, tooling pengembang, dan integrasi cloud sering menjadi faktor utama dalam memilih hardware.
Beberapa pola penting muncul dari generasi akselerator AI saat ini:
Dengan ukuran model AI yang terus meningkat, faktor seperti arsitektur memori, jaringan interkoneksi, kemampuan manufaktur, dan ekosistem software kemungkinan akan menentukan platform mana yang mendominasi komputasi AI di masa depan.
Comments
0 comments