Thiết kế này nhằm đáp ứng nhu cầu của các hệ thống AI agent, vốn cần dung lượng bộ nhớ lớn và giao tiếp tốc độ cao giữa các chip để xử lý tác vụ dài và nhiều bước.
Hiệu năng của các cụm AI lớn không chỉ phụ thuộc vào sức mạnh từng chip mà còn ở khả năng kết nối giữa các bộ tăng tốc.
Zhenwu M890 sử dụng kiến trúc tính toán song song do Alibaba tự phát triển, cung cấp băng thông kết nối chip‑to‑chip lên tới 800GB/s.
Ngoài ra, Alibaba còn giới thiệu ICN Switch 1.0, một chip mạng cho phép 64 card tăng tốc kết nối toàn băng thông, điều quan trọng đối với việc huấn luyện mô hình lớn hoặc phục vụ hàng loạt yêu cầu suy luận đồng thời.
Cách tiếp cận này nhằm giảm “nút thắt cổ chai” giao tiếp thường xuất hiện trong các cụm GPU quy mô lớn.
Để đưa chip vào hạ tầng thực tế, Alibaba giới thiệu máy chủ hyperscale Panjiu AL128, được xây dựng quanh Zhenwu M890.
Hệ thống này có thể kết nối 128 bộ tăng tốc AI trong cùng một node, nhờ ICN Switch 1.0 với độ trễ cực thấp.
Các node mật độ cao như vậy được thiết kế cho:
Việc tự thiết kế cả chip lẫn kiến trúc máy chủ giúp Alibaba tối ưu hiệu năng toàn hệ thống thay vì phụ thuộc vào phần cứng bên thứ ba.
Song song với phần cứng, Alibaba cũng ra mắt Qwen3.7‑Max, phiên bản mới của dòng mô hình ngôn ngữ lớn Qwen.
Mô hình này được định vị là nền tảng cho các hệ thống AI agent, với thế mạnh ở:
Theo Alibaba, Qwen3.7‑Max có thể vận hành các nhiệm vụ tự động trong tối đa khoảng 35 giờ mà không suy giảm hiệu năng.
Những khả năng này đặc biệt hữu ích cho các tác vụ như phát triển phần mềm, phân tích dữ liệu hoặc tự động hóa vận hành.
Các công bố mới cho thấy Alibaba đang xây dựng một nền tảng AI tích hợp gồm nhiều lớp:
Cách tiếp cận này tương tự chiến lược của Nvidia, nơi phần cứng, mạng và phần mềm được tối ưu hóa đồng bộ để đạt hiệu năng tối đa cho các hệ thống AI quy mô lớn.
Alibaba cho rằng ngành công nghiệp đang bước vào “kỷ nguyên agentic AI”, nơi các mô hình không chỉ trả lời câu hỏi mà còn tự lập kế hoạch, hành động và phối hợp với các công cụ phần mềm khác.
Công ty cũng công bố kế hoạch phát triển tiếp theo cho dòng Zhenwu:
Lộ trình này cho thấy Alibaba đang theo đuổi chiến lược dài hạn nhằm nâng cao năng lực chip AI nội địa.
Sự kiện này phản ánh xu hướng rộng hơn trong ngành công nghệ Trung Quốc. Khi các hạn chế xuất khẩu của Mỹ làm giảm khả năng tiếp cận chip Nvidia tiên tiến, nhiều công ty Trung Quốc đang tăng tốc phát triển hệ sinh thái AI “cây nhà lá vườn”.
Nếu thành công, nền tảng của Alibaba có thể cung cấp cho các nhà phát triển trong nước một chuỗi hạ tầng hoàn chỉnh — từ chip, máy chủ, đến dịch vụ cloud và mô hình AI.
Tuy vậy, nhiều tuyên bố về hiệu năng hiện vẫn dựa trên thông tin do công ty công bố hoặc các báo cáo truyền thông. Các so sánh benchmark độc lập với GPU Nvidia như H100 hoặc các thế hệ mới hơn vẫn chưa được công bố rộng rãi.
Dù vậy, động thái này cho thấy một xu hướng rõ ràng: các nhà cung cấp cloud lớn đang cạnh tranh để kiểm soát toàn bộ “AI stack”, và Alibaba đang cố gắng trở thành một trụ cột của hạ tầng AI nội địa tại Trung Quốc.
Comments
0 comments