Nền tảng được xây dựng trên OceanStor Pacific, hệ thống lưu trữ phân tán mở rộng theo cụm (scale‑out) của Huawei, dùng để chứa khối lượng dữ liệu AI rất lớn và các vector embedding phục vụ mô hình AI.
Huawei cho biết hệ thống có thể đạt tối đa 11 petabyte dung lượng trong khung 2U, nhằm tăng mật độ lưu trữ trong trung tâm dữ liệu và giảm tổng chi phí vận hành cho các hệ thống AI quy mô lớn.
Phía trên lớp lưu trữ là DME Omni‑Dataverse, nền tảng quản lý dữ liệu hợp nhất. Công cụ này cho phép:
Huawei cho biết nền tảng có thể tìm kiếm dữ liệu trong hàng trăm tỷ vector chỉ trong vài giây, điều quan trọng với các hệ thống AI dựa trên tri thức hoặc retrieval‑augmented generation.
Lớp tiếp theo tập trung vào triển khai và chạy mô hình AI hiệu quả hơn.
Hai công nghệ chính gồm:
CMS cho phép sử dụng nhiều loại phần cứng tính toán khác nhau và có thể xây dựng pool bộ nhớ KV‑cache dung lượng lớn, giúp tăng tốc quá trình suy luận. Huawei cho biết điều này có thể giảm đáng kể độ trễ khi mô hình tạo token đầu tiên.
ModelEngine đóng vai trò như cổng mô hình (model gateway) và hệ thống triển khai, cho phép đưa mô hình mới vào vận hành nhanh với cấu hình tối thiểu.
Huawei cũng giới thiệu Nexent, một nền tảng AI agent dành cho doanh nghiệp. Nexent hoạt động cùng ModelEngine để điều phối các AI agent trong quy trình công việc kinh doanh.
Mục tiêu là giúp doanh nghiệp biến mô hình AI thành các tác nhân tự động có thể:
Trong kiến trúc của Huawei, lớp này giúp chuyển các mô hình đã triển khai thành AI agent thực sự phục vụ hoạt động doanh nghiệp.
Lớp cuối cùng tập trung vào độ tin cậy và bảo mật dữ liệu cho hạ tầng AI. Huawei gọi đây là lớp “data resilience”.
Các khả năng được nhắc tới gồm:
Những cơ chế này nhằm bảo vệ hệ thống AI trước các rủi ro như tấn công ransomware hoặc sự cố hạ tầng, vốn có thể làm gián đoạn hoạt động của trung tâm dữ liệu AI.
Huawei cho biết kiến trúc tích hợp này có thể cải thiện đáng kể hiệu suất vận hành AI doanh nghiệp.
Một số con số được hãng đưa ra gồm:
Những con số này dựa trên các thử nghiệm nội bộ hoặc kịch bản cụ thể của Huawei và không nhất thiết phản ánh hiệu suất trong mọi môi trường triển khai.
Huawei cũng đề cập đến một số trường hợp ứng dụng sớm của hạ tầng này.
Ví dụ, nhà bán lẻ Pháp Auchan đã triển khai phần cứng Huawei và các cụm hạ tầng trung tâm dữ liệu tại ba trung tâm dữ liệu ở Pháp như một phần của quá trình hiện đại hóa hệ thống CNTT.
Tuy nhiên, các nguồn công khai hiện chưa cho thấy bằng chứng rõ ràng rằng việc giảm chi phí đám mây của Auchan đến trực tiếp từ nền tảng mới của Huawei; việc tối ưu chi phí có thể liên quan đến nhiều công nghệ và nhà cung cấp khác trong quá trình chuyển đổi hạ tầng.
Động thái của Huawei phản ánh xu hướng lớn trong ngành: xây dựng hạ tầng AI tích hợp theo chiều dọc. Thay vì nhiều công cụ rời rạc cho lưu trữ dữ liệu, quản lý vector, suy luận mô hình và điều phối AI agent, các nhà cung cấp đang gộp chúng thành một nền tảng thống nhất.
Trong cách tiếp cận của Huawei, dữ liệu được xem là trung tâm của hiệu năng AI. Vì vậy, lưu trữ dữ liệu, truy xuất vector, bộ nhớ cache và điều phối mô hình đều được thiết kế như những thành phần cốt lõi của trung tâm dữ liệu AI.
Nếu mô hình kiến trúc này được doanh nghiệp áp dụng rộng rãi, nó có thể trở thành xương sống vận hành cho các trung tâm dữ liệu AI thế hệ mới, nơi dữ liệu, mô hình và AI agent hoạt động trong cùng một nền tảng hạ tầng.
Comments
0 comments