Venice được xây dựng trên kiến trúc vi mô Zen 6 của AMD và đánh dấu một bước nhảy vọt đáng kể về thế hệ . Con chip này chuyển sang socket SP7 mới và mang theo một loạt nâng cấp kỹ thuật mạnh mẽ.
Ở phân khúc cao nhất, Venice cung cấp lên đến 256 nhân trên mỗi socket—một sự gia tăng đáng kể từ 192 nhân của Turin . Băng thông bộ nhớ nhảy từ 614 GB/s lên 1.6 TB/s, tức cải thiện gấp 2.6 lần, nhờ bộ điều khiển bộ nhớ 16 kênh DDR5 mới và việc chuyển sang PCIe 6.0, giúp tăng gấp đôi băng thông kết nối CPU-GPU
.
AMD tuyên bố hiệu năng điện toán và hiệu quả cải thiện khoảng 70% so với thế hệ EPYC Turin hiện tại, cùng với mật độ luồng cao hơn khoảng 1.3 lần trên cùng một diện tích socket . Công ty cũng giới thiệu công nghệ đóng gói 2.5D dựa trên EFB để tăng cường băng thông kết nối giữa các chiplet
.
Quá trình sản xuất đã bắt đầu tại nhà máy của TSMC ở Đài Loan vào ngày 20 tháng 5 năm 2026, và AMD có kế hoạch mở rộng sản xuất sang khuôn viên Arizona của TSMC vào cuối năm nay . Các lô hàng cho khách hàng dự kiến sẽ bắt đầu vào nửa cuối năm, phù hợp với các đợt triển khai rack Helios đầu tiên
.
Helios đại diện cho bước tiến của AMD vào lĩnh vực thiết kế hệ thống cấp rack dành cho AI và HPC. Trước đây được mô tả là "bản thiết kế cho hạ tầng yotta-scale", Helios tích hợp CPU Venice, GPU Instinct MI455X và mạng Pensando vào một rack làm mát bằng chất lỏng, rộng gấp đôi, có khả năng cung cấp tới 2.9 exaflop sức mạnh tính toán AI .
Một rack Helios duy nhất chứa 72 tăng tốc Instinct MI455X bên cạnh 4.600 nhân CPU và 18.000 đơn vị tính toán GPU, được kết nối bởi 31 TB bộ nhớ HBM4 . Các GPU MI455X sử dụng cả công nghệ tiến trình 2nm và 3nm cùng đóng gói chiplet 3D, với mỗi tăng tốc cung cấp khoảng 40 petaflop hiệu năng suy luận FP4 dày đặc
.
Meta đã cam kết là đối tác triển khai lớn đầu tiên, với thỏa thuận 6 gigawatt trải dài qua nhiều thế hệ GPU và đợt triển khai gigawatt đầu tiên được lên lịch vào nửa cuối năm 2026 .
Đằng sau những thông báo về phần cứng, AMD đã đưa ra một lập luận chiến lược quan trọng hơn: AI chủ động (Agentic AI) đang viết lại các quy luật về nhu cầu CPU bên trong trung tâm dữ liệu.
Các tác vụ AI truyền thống—chẳng hạn như suy luận mô hình đơn hoặc chạy huấn luyện—thường sử dụng một CPU để "nuôi" bốn, năm, hoặc thậm chí tám GPU. Công việc của CPU trong cấu hình đó tương đối nhẹ nhàng. Nhưng các tác vụ AI chủ động thì khác biệt về bản chất. Thay vì một truy vấn đơn lẻ, các hệ thống tác nhân AI thực thi các quy trình làm việc nhiều bước, bao gồm lập kế hoạch, sử dụng công cụ, quản lý bộ nhớ, lập lịch và phối hợp trên nhiều mô hình và nguồn dữ liệu. Tất cả sự phối hợp đó đều chạy trên các CPU đa năng.
"Suy luận và AI chủ động đang làm tăng căn bản các yêu cầu tính toán, thúc đẩy cả việc triển khai tăng tốc quy mô lớn hơn lẫn nhu cầu tính toán CPU nhiều hơn đáng kể," CEO AMD Lisa Su phát biểu trong cuộc gọi báo cáo thu nhập quý 1 năm 2026 .
Phân tích nội bộ của AMD hiện dự báo tỷ lệ CPU/GPU sẽ được nén từ phạm vi 1:4-5 hiện tại xuống xấp xỉ 1:1 khi AI chủ động mở rộng quy mô . Trong một số trường hợp, bà Su cho rằng tỷ lệ này thậm chí có thể đảo ngược, với số CPU nhiều hơn GPU trên mỗi nút nếu việc triển khai tác nhân trở nên đủ dày đặc
.
Đây không chỉ là luận điểm của riêng AMD. Intel cũng đã đưa ra các tuyên bố tương tự, lưu ý rằng tỷ lệ này có thể thắt chặt về 1:1 trong các kịch bản tác nhân AI. Phân tích của bên thứ ba từ TrendForce dự báo nhu cầu lõi CPU sẽ tăng gấp bốn lần trên mỗi gigawatt dung lượng trung tâm dữ liệu trong kỷ nguyên AI Agent .
Các tác động thị trường là rất lớn. AMD đã tăng gấp đôi dự báo tổng thị trường khả dụng (TAM) cho CPU máy chủ từ khoảng 60 tỷ USD lên 120 tỷ USD vào năm 2030, hiện dự kiến mức tăng trưởng hàng năm trên 35% thay vì 18% như trước đó . Một cuộc khủng hoảng thiếu hụt CPU máy chủ đã xuất hiện trong năm 2026, được thúc đẩy bởi làn sóng xây dựng hạ tầng AI chủ động và các chu kỳ làm mới của doanh nghiệp va chạm với năng lực sản xuất bị hạn chế
.
Các nhà đầu tư đã phản ứng nhanh chóng với câu chuyện về nhu cầu CPU. Cổ phiếu AMD đã tăng vọt 19% lên mức kỷ lục khoảng 421 USD sau báo cáo thu nhập quý 1 năm 2026, trong đó bao gồm việc nâng cấp TAM CPU máy chủ lên 120 tỷ USD . Thị trường diễn giải việc điều chỉnh TAM này là bằng chứng cho một sự dịch chuyển cấu trúc bền vững, không phải là một cú tăng đột biến tạm thời về nhu cầu.
Cộng đồng nhà phân tích nói chung đều lạc quan về luận điểm này. Lập luận rằng AI chủ động kéo theo tỷ lệ "đính kèm" CPU lớn hơn cho mỗi đô la chi tiêu vốn (capex) cho AI đã khiến nhiều công ty bên bán nâng cao ước tính và mục tiêu giá . Các ghi chú cụ thể từ Barclays và UBS không có sẵn trong bằng chứng nguồn, nhưng phản ứng tổng hợp của thị trường là tích cực một cách rõ ràng, với việc tỷ lệ CPU/GPU được nén lại là chất xúc tác cốt lõi.
Vai trò của Supermicro tại Computex 2026 không chỉ là một màn giới thiệu đối tác thông thường. Công ty là một trong những đối tác đầu tiên đưa Helios ra thị trường và đã sử dụng gian hàng của mình để trình diễn một rack rộng gấp đôi 72 GPU hoạt động hoàn chỉnh, được xây dựng trên kiến trúc Data Center Building Block Solutions của họ .
Hệ thống kết hợp GPU Instinct MI455X, CPU EPYC Venice thế hệ thứ 6 và các card mạng thông minh (smart NIC) và bộ xử lý dữ liệu (DPU) Pensando, được hợp nhất dưới ngăn xếp phần mềm mở ROCm của AMD . Nó nhắm mục tiêu vào các tác vụ đào tạo AI quy mô lớn, suy luận, AI có chủ quyền (Sovereign AI) và tinh chỉnh các mô hình ngôn ngữ lớn (LLM), với khả năng mở rộng mô-đun từ một rack đơn lẻ đến triển khai toàn bộ cụm
.
Màn trình diễn đã đưa ra một tuyên bố rõ ràng: Helios không phải là một nền tảng trên giấy. Đó là một hệ thống thực tế, có thể triển khai, với sự hỗ trợ từ hệ sinh thái của các nhà sản xuất OEM lớn, và nó đã sẵn sàng cạnh tranh cho các hợp đồng hạ tầng AI siêu quy mô và NeoCloud bắt đầu từ cuối năm nay.
Sự kiện mùa thu điển hình của AMD, Advancing AI, là địa điểm tự nhiên cho làn sóng công bố lớn tiếp theo. Với việc Venice đã đi vào sản xuất và các đợt triển khai Helios được lên lịch vào nửa cuối năm 2026, những thông báo được mong đợi nhất bao gồm thông số kỹ thuật và giá cuối cùng của Venice, chi tiết kiến trúc sâu hơn về các GPU dòng MI450X và MI455X, các khách hàng triển khai Helios mới ngoài Meta, và bản xem trước về bộ xử lý EPYC 'Verano' thế hệ tiếp theo đã được xác nhận cho năm 2027 .
Các kiến trúc tham chiếu AI chủ động mở rộng cũng có khả năng được tiết lộ, cho thấy chi tiết hơn về cách AMD kỳ vọng các rack máy chủ CPU sẽ tích hợp với hạ tầng GPU khi ngành công nghiệp chuyển sang tỷ lệ CPU/GPU dày đặc hơn.
Thông điệp của AMD tại Computex 2026 rất rõ ràng: công ty tin rằng trung tâm dữ liệu sắp tiêu thụ CPU với một tốc độ mà chưa có dự báo nào từng nắm bắt được. Venice và Helios được xây dựng để đón đầu thời khắc đó.
Comments
0 comments