Bên trong Command A+: mô hình AI 218B tham số của Cohere được thiết kế cho doanh nghiệp và hạ tầng AI chủ quyền
Command A+ là mô hình Mixture‑of‑Experts 218B tham số của Cohere nhưng chỉ kích hoạt khoảng 25B tham số cho mỗi token, giúp giảm chi phí suy luận so với mô hình dense lớn. Mô hình hỗ trợ 48 ngôn ngữ, context window 128.000 token, đầu vào đa phương thức (bao gồm hình ảnh) cùng các tính năng doanh nghiệp như tool‑use,...
What are the key features, architecture, performance benchmarks, deployment requirements, and strategic goals behind Cohere’s newly releasedCommand A+ introduces a 218B‑parameter Mixture‑of‑Experts architecture designed for enterprise and sovereign AI deployments.
Prompt AI
Create a landscape editorial hero image for this Studio Global article: What are the key features, architecture, performance benchmarks, deployment requirements, and strategic goals behind Cohere’s newly released. Article summary: Cohere’s Command A+ is positioned as an open-source, enterprise/sovereign-AI flagship: a 218B-parameter Mixture-of-Experts model with about 25B active parameters per token, built to combine reasoning, vision, multilingua. Topic tags: general, documentation, academic, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "Cohere Releases Command A+: An Open-Source Enterprise AI Model Built for Sovereign Critical Infrastructure. Business Wire; May 20, 2026; 15 mins" source context "Cohere Releases Command A+: An Open-Source Enterprise AI Model Built for Sovereign Critical Infrastructure | National Bu" Refer
openai.com
Command A+: mô hình AI mã nguồn mở mới của Cohere
Cohere vừa công bố Command A+, một mô hình ngôn ngữ lớn mã nguồn mở hướng tới các tổ chức doanh nghiệp và cơ quan chính phủ cần hiệu năng cao nhưng vẫn kiểm soát được hạ tầng và dữ liệu. Điểm đáng chú ý là mô hình sử dụng kiến trúc Mixture‑of‑Experts (MoE) với 218 tỷ tham số tổng, nhưng chỉ khoảng 25 tỷ tham số được kích hoạt cho mỗi token trong quá trình suy luận.
Cách thiết kế này cho phép mô hình đạt năng lực cao trong khi chi phí tính toán vẫn tương đối hợp lý — yếu tố quan trọng đối với các hệ thống AI triển khai trong môi trường sản xuất của doanh nghiệp.
Theo Cohere, Command A+ không chỉ là một bản nâng cấp kỹ thuật mà còn là nền tảng cho chiến lược lớn hơn của công ty: xây dựng hạ tầng “AI chủ quyền” (sovereign AI) để các quốc gia và tổ chức có thể vận hành AI ngay trong hệ thống của mình.
Các khả năng chính của Command A+
Command A+ hợp nhất nhiều năng lực trước đây nằm rải rác ở các mô hình khác trong dòng Command thành một hệ thống duy nhất. Tài liệu chính thức cho biết mô hình hỗ trợ:
Sinh nội dung đa ngôn ngữ trên 48 ngôn ngữ
Studio Global AI
Search, cite, and publish your own answer
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
Câu trả lời ngắn gọn cho "Bên trong Command A+: mô hình AI 218B tham số của Cohere được thiết kế cho doanh nghiệp và hạ tầng AI chủ quyền" là gì?
Command A+ là mô hình Mixture‑of‑Experts 218B tham số của Cohere nhưng chỉ kích hoạt khoảng 25B tham số cho mỗi token, giúp giảm chi phí suy luận so với mô hình dense lớn.
Những điểm chính cần xác nhận đầu tiên là gì?
Command A+ là mô hình Mixture‑of‑Experts 218B tham số của Cohere nhưng chỉ kích hoạt khoảng 25B tham số cho mỗi token, giúp giảm chi phí suy luận so với mô hình dense lớn. Mô hình hỗ trợ 48 ngôn ngữ, context window 128.000 token, đầu vào đa phương thức (bao gồm hình ảnh) cùng các tính năng doanh nghiệp như tool‑use, trích dẫn và structured output.
Tôi nên làm gì tiếp theo trong thực tế?
Cohere định vị Command A+ là nền tảng cho chiến lược “sovereign AI”, cho phép chính phủ và doanh nghiệp chạy mô hình trong hạ tầng riêng thay vì phụ thuộc vào API của các hyperscaler.
Đầu vào đa phương thức, bao gồm khả năng hiểu hình ảnh bên cạnh văn bản
Reasoning và agentic tasks như sử dụng công cụ (tool use) hoặc tự động hóa quy trình làm việc
Structured outputs và trích dẫn (citations) cho các ứng dụng doanh nghiệp
Context window 128.000 token, phù hợp với tài liệu dài hoặc hệ thống truy xuất tri thức
Những tính năng này nhắm tới các kịch bản phổ biến trong doanh nghiệp như:
Retrieval‑Augmented Generation (RAG)
trợ lý AI nội bộ cho tri thức công ty
các agent tự động tương tác với hệ thống nội bộ
Các khả năng này cho phép mô hình đóng vai trò nền tảng cho các workflow tự động hóa dựa trên AI trong môi trường sản xuất.
Kiến trúc: 218B tham số nhưng chỉ kích hoạt 25B
Điểm khác biệt lớn nhất của Command A+ là kiến trúc Mixture‑of‑Experts (MoE).
Thông số chính:
218 tỷ tham số tổng trong toàn bộ mô hình
Khoảng 25 tỷ tham số hoạt động cho mỗi token trong quá trình suy luận
Trong hệ thống MoE, mô hình gồm nhiều “expert” chuyên biệt. Khi xử lý mỗi token, chỉ một số expert được kích hoạt dựa trên bộ định tuyến (router). Điều này giúp:
giảm lượng tính toán so với mô hình dense
giữ hiệu năng cao cho các tác vụ phức tạp
Cohere mô tả thiết kế này là cách đạt hiệu năng cao với chi phí compute thấp, đặc biệt phù hợp với workload doanh nghiệp nơi chi phí vận hành và khả năng triển khai linh hoạt rất quan trọng.
Yêu cầu triển khai phần cứng
Mặc dù có hơn 200 tỷ tham số, Command A+ được thiết kế để chạy trên cấu hình phần cứng tương đối gọn nhờ kiến trúc MoE.
Các cấu hình triển khai được báo cáo gồm:
1 GPU Nvidia B200, hoặc
2 GPU Nvidia H100
Đối với một mô hình trên 200B tham số, yêu cầu này được xem là khá thấp. Điều đó phản ánh lợi ích của cơ chế kích hoạt thưa (sparse activation) trong MoE.
Cohere cũng cung cấp Command A+ thông qua Model Vault và Chat API, giúp doanh nghiệp đưa mô hình vào môi trường sản xuất dễ dàng hơn.
Quan trọng hơn, tổ chức có thể triển khai mô hình trong hạ tầng riêng (private cloud hoặc on‑premise) thay vì gửi dữ liệu nhạy cảm đến API của nhà cung cấp bên ngoài.
Giấy phép mã nguồn mở
Command A+ được phát hành dưới giấy phép Apache 2.0, một trong những giấy phép mã nguồn mở phổ biến và tự do nhất.
Điều này cho phép:
sử dụng cho mục đích thương mại
chỉnh sửa và triển khai mô hình
không áp đặt các hạn chế riêng về quy mô hoặc doanh thu
Trong bối cảnh nhiều mô hình “open‑weight” gần đây vẫn đặt hạn chế sử dụng thương mại, việc chọn Apache 2.0 được xem là một bước đi đáng chú ý.
Hiệu năng và vị trí trong dòng Command
Theo Cohere, Command A+ vượt qua các thế hệ trước trong dòng Command và hợp nhất nhiều khả năng trước đây được tách thành các mô hình riêng như:
Command A Reasoning
Command A Vision
Nhờ đó, một mô hình duy nhất có thể xử lý reasoning, hình ảnh, đa ngôn ngữ và agentic tasks.
Tuy nhiên, các tài liệu công bố ban đầu không cung cấp bảng benchmark chi tiết hoặc điểm số cụ thể, nên các so sánh định lượng độc lập với các mô hình khác hiện vẫn còn hạn chế.
Vai trò trong chiến lược “Sovereign AI”
Cohere định vị Command A+ là một phần của chiến lược lớn hơn: AI chủ quyền (sovereign AI).
Khái niệm này nhấn mạnh:
quyền kiểm soát toàn bộ môi trường training và inference
lưu trữ dữ liệu trong phạm vi pháp lý của quốc gia
giảm phụ thuộc vào các nền tảng cloud toàn cầu
Công ty tiếp thị mô hình này như giải pháp phù hợp cho hạ tầng quan trọng của chính phủ và các ngành được quản lý chặt chẽ như tài chính, y tế và năng lượng.
Bối cảnh chiến lược rộng hơn của Cohere
Việc phát hành Command A+ diễn ra cùng nhiều động thái chiến lược nhằm xây dựng hệ sinh thái AI chủ quyền.
Kế hoạch hợp nhất với Aleph Alpha
Cohere công bố kế hoạch sáp nhập với công ty AI Đức Aleph Alpha nhằm tạo ra một nhà cung cấp AI xuyên Đại Tây Dương phục vụ doanh nghiệp và khu vực công.
Khoản đầu tư lớn từ Schwarz Group
Các công ty thuộc tập đoàn bán lẻ Đức Schwarz Group cam kết 600 triệu USD (≈500 triệu euro) tài trợ cho vòng gọi vốn của Cohere và sáng kiến AI chủ quyền.
Mở rộng sang các ngành được quản lý
Cohere cũng đã mua lại Reliant AI để mở rộng các giải pháp AI doanh nghiệp trong lĩnh vực y sinh và chăm sóc sức khỏe.
Những động thái này cho thấy Command A+ không chỉ là một mô hình mới mà là một thành phần trong chiến lược xây dựng hệ sinh thái AI độc lập với các hyperscaler truyền thống.
Kết luận
Command A+ kết hợp hai yếu tố quan trọng: hiệu quả kiến trúc và định vị chiến lược.
Về kỹ thuật, mô hình cung cấp kiến trúc MoE quy mô lớn, khả năng đa phương thức, context dài và các công cụ doanh nghiệp trong khi vẫn giữ yêu cầu phần cứng tương đối thấp.
Về chiến lược, nó củng cố tham vọng của Cohere trở thành nhà cung cấp AI có thể triển khai riêng cho chính phủ và doanh nghiệp, đặc biệt trong bối cảnh nhiều quốc gia muốn kiểm soát chặt chẽ dữ liệu và hạ tầng AI của mình.
Nếu chiến lược này thành công, Command A+ có thể được nhớ đến không chỉ như một mô hình mới, mà như một bước quan trọng trong sự hình thành của các hệ sinh thái AI thay thế ngoài các nền tảng cloud thống trị hiện nay.
Comments
0 comments