| 918 TFLOPs bf16 |
| 32GB HBM |
| ~1.6 TB/s |
| Không công bố |
| Thiết kế cho cụm TPU pod tối đa 256 chip. |
| Huawei Ascend 910 | Trung Quốc / Huawei | Da Vinci, ~7nm | ~256 TFLOPS FP16 | HBM | ~1.2 TB/s | ~350W | Chip AI chủ lực của Huawei ra mắt 2019. |
| Huawei Ascend 910C | Trung Quốc / Huawei | Chiplet (2 die 910B) | ~800 TFLOPS FP16 (ước tính) | ~96–128GB HBM | ~3.2 TB/s | ~310W | Hướng tới cạnh tranh GPU AI cao cấp. |
| Biren BR100 | Trung Quốc / Biren | GPU dual‑die, TSMC 7nm CoWoS | 256 TFLOPS FP32 / ~2048 TOPS INT8 | 64GB HBM2E | ~2.3 TB/s | ~550W | GPU chiplet ~77 tỷ transistor cho AI datacenter. |
| Biren BR104 | Trung Quốc / Biren | GPU single‑die | ~128 TFLOPS FP32 | 32GB HBM2E | ~819 GB/s | ~300W | Phiên bản PCIe chi phí thấp hơn. |
| Cambricon MLU370‑X8 | Trung Quốc / Cambricon | MLUarch03, 7nm | 24 TFLOPS FP32 / 96 TFLOPS FP16 / 256 TOPS INT8 | 48GB LPDDR5 | ~614 GB/s | ~250W | Hỗ trợ cụm nhiều card qua MLU‑Link. |
Các bộ gia tốc AI của Mỹ hiện vẫn có lợi thế rõ rệt về thông số tính toán cao cấp.
Trong khi đó, các chip Trung Quốc đang thu hẹp khoảng cách.
Các mô hình AI hiện đại phụ thuộc rất nhiều vào HBM (High Bandwidth Memory) để xử lý tensor kích thước lớn.
Một số điểm đáng chú ý:
Băng thông cao đặc biệt quan trọng cho các phép toán ma trận trong huấn luyện LLM.
Trong thực tế, các mô hình AI lớn không chạy trên một chip mà trên hàng trăm hoặc hàng nghìn accelerator.
Điều này cho thấy kiến trúc hệ thống và mạng liên kết ngày càng quan trọng ngang với hiệu năng của từng chip riêng lẻ.
Khả năng sản xuất bán dẫn ảnh hưởng trực tiếp đến hiệu năng và hiệu suất năng lượng.
Trong khi đó, các chip của Mỹ thường tận dụng chuỗi cung ứng bán dẫn tiên tiến toàn cầu, giúp tiếp cận các công nghệ sản xuất và đóng gói mới nhất.
Trong lĩnh vực AI, phần mềm thường quan trọng không kém phần cứng.
Khả năng tích hợp với framework AI và nền tảng cloud thường quyết định việc doanh nghiệp lựa chọn phần cứng nào.
Một số xu hướng nổi bật từ thế hệ chip hiện nay:
Vì vậy, cuộc cạnh tranh chip AI Mỹ–Trung không chỉ là cuộc đua về transistor hay TFLOPs. Nó còn là cuộc cạnh tranh về hệ sinh thái phần mềm, năng lực sản xuất bán dẫn và kiến trúc hạ tầng AI quy mô lớn.
Trong bối cảnh các mô hình AI tiếp tục tăng kích thước và nhu cầu tính toán, những yếu tố này sẽ quyết định nền tảng nào chiếm ưu thế trong tương lai.
Comments
0 comments