Câu trả lời ngắn: DeepSeek là mối đe dọa thật sự, nhưng chưa thể nói hãng đã “đánh bại” OpenAI, Claude, Gemini hay Grok. Điều DeepSeek làm được là kéo mô hình AI gần tuyến đầu xuống một mặt bằng chi phí mới, đồng thời đưa lựa chọn mở trọng số vào cuộc chơi chính thống [10][
12][
17].
Nhưng thắng trong AI không chỉ là đứng cao trên một bảng benchmark. Đó còn là chuyện ai có sản phẩm dễ dùng hơn, API ổn định hơn, thương hiệu mạnh hơn, hợp đồng doanh nghiệp tốt hơn, quản trị dữ liệu rõ ràng hơn và được cơ quan quản lý tin tưởng hơn [73][
74]. Ở những phần đó, cuộc đua mới chỉ bắt đầu.
Trước hết, “đánh bại” nghĩa là gì?
Nếu “đánh bại” nghĩa là có năng lực tiệm cận các mô hình đóng hàng đầu trong một số bài kiểm tra, DeepSeek đã đáng được xếp vào nhóm phải theo dõi. Báo cáo kỹ thuật DeepSeek-V3 nói V3-Base là một trong những mô hình nền tảng nguồn mở mạnh nhất thời điểm đó, đặc biệt nổi bật ở lập trình và toán; bản chat cũng đạt kết quả có thể so sánh với GPT-4o và Claude-3.5-Sonnet trên nhiều benchmark chuẩn và mở [1].
Nếu “đánh bại” nghĩa là trở thành nền tảng AI mặc định của thế giới, câu chuyện khác hẳn. Khi một doanh nghiệp chọn mô hình để đưa vào sản phẩm, họ không chỉ hỏi mô hình nào trả lời thông minh nhất trong một lần thử. Họ còn hỏi: chi phí mỗi triệu token ra sao, độ trễ thế nào, có dễ tích hợp không, dữ liệu được lưu ở đâu, hợp đồng có ràng buộc trách nhiệm gì, có đáp ứng kiểm toán và quy định địa phương không.
Nói cách khác, bảng xếp hạng là điểm khởi đầu. Chi phí, phân phối và niềm tin mới là cuộc đua đường dài.
Lợi thế lớn nhất của DeepSeek: làm AI mạnh trở nên rẻ hơn
DeepSeek gây chấn động không chỉ vì có thêm một chatbot mới. Hãng khiến cả ngành phải tính lại giả định rằng mô hình AI mạnh nhất định phải cực kỳ đắt đỏ. IISS cho biết DeepSeek-V3 ra mắt tháng 12/2024, R1 ra mắt tháng 1/2025; V3 gây chú ý nhờ hiệu quả và chi phí huấn luyện thấp hơn, còn R1 được chú ý vì năng lực suy luận có thể sánh với các mô hình suy luận đóng gần tuyến đầu như OpenAI o1 [10].
Các con số kỹ thuật củng cố câu chuyện đó. Theo GitHub chính thức của DeepSeek, V3 có tổng cộng 671 tỷ tham số, nhưng mỗi token chỉ kích hoạt 37 tỷ tham số; mô hình được tiền huấn luyện trên 14,8 nghìn tỷ token với chi phí 2,664 triệu giờ GPU H800 [17]. Đây là lý do DeepSeek được nhìn như một lời nhắc mạnh: năng lực gần tuyến đầu không nhất thiết chỉ thuộc về các công ty đóng có vốn và cụm GPU lớn nhất.
Giá API cũng là mấu chốt. Tài liệu DeepSeek tính giá theo mỗi triệu token, tách riêng token đầu vào trúng bộ nhớ đệm, không trúng bộ nhớ đệm và token đầu ra; tài liệu cũng cho thấy tên mô hình và cơ chế giá có thể thay đổi, nên các quyết định mua chính thức vẫn cần dựa trên trang giá mới nhất của hãng [12]. Với các hệ thống dùng nhiều API như RAG, tóm tắt hàng loạt, làm sạch dữ liệu, nháp phản hồi chăm sóc khách hàng hay trợ lý lập trình nội bộ, chỉ cần chất lượng đạt ngưỡng dùng được, chi phí và độ ổn định có thể quan trọng hơn một câu trả lời “ấn tượng” trong demo.
Mạnh, nhưng không nên thần thánh hóa một bảng điểm
Điểm sáng công khai của DeepSeek nằm nhiều ở lập trình, toán và suy luận. Báo cáo V3 nêu rõ thế mạnh ở code và math [1]. IISS mô tả R1 là mô hình mở trọng số có năng lực suy luận, đạt mức ngang hàng với các mô hình suy luận đóng gần tuyến đầu như OpenAI o1 [
10]. Reuters cũng mô tả bản nâng cấp mô hình DeepSeek tháng 3/2025 là động thái làm gia tăng cạnh tranh với OpenAI [
92].
Tuy vậy, không nên suy ra rằng DeepSeek thắng trong mọi tình huống. Viết sáng tạo, làm việc với tài liệu dài, sản phẩm đa phương thức, gọi công cụ ổn định, an toàn nội dung, tích hợp doanh nghiệp và trách nhiệm tuân thủ đều cần thử trong quy trình thật. Với nhóm sản phẩm, câu hỏi thực tế không phải là mô hình nào đứng đầu tổng bảng, mà là mô hình nào hoàn thành nhiều tác vụ thành công nhất với mức chi phí và rủi ro chấp nhận được.
Gây sốt không đồng nghĩa với chiến thắng lâu dài
DeepSeek đã tạo ra cú sốc thị trường rõ ràng. CNBC đưa tin DeepSeek vượt ChatGPT để đứng đầu bảng ứng dụng miễn phí được tải nhiều nhất trên Apple App Store tại Mỹ vào tháng 1/2025 [96]. Reuters cũng cho biết đợt ra mắt đầu tiên của DeepSeek trong tháng 1/2025 đã kích hoạt làn sóng bán tháo cổ phiếu công nghệ toàn cầu và thổi bay 593 tỷ USD vốn hóa của Nvidia [
30].
Những sự kiện đó chứng minh câu chuyện “AI mạnh nhưng rẻ” đủ sức làm nhà đầu tư, lập trình viên và người dùng phổ thông chú ý. Nhưng thứ hạng tải ứng dụng và phản ứng thị trường chứng khoán là tín hiệu về độ nóng, không phải bằng chứng về chiến thắng nền tảng. Reuters năm 2026 đưa tin một mô hình mới của DeepSeek không còn khiến thị trường kinh ngạc trong ngành AI thay đổi rất nhanh, cho thấy chuẩn kỳ vọng đã tăng lên và một cú sốc ban đầu không đảm bảo vị thế dẫn đầu qua nhiều thế hệ [26].
DeepSeek đe dọa từng đối thủ ra sao?
OpenAI: chịu áp lực giá lớn nhất, nhưng vẫn có hào sâu thương hiệu
OpenAI là bên chịu áp lực trực tiếp nhất từ câu chuyện chi phí và hiệu quả của DeepSeek. Tuy vậy, OpenAI vẫn có lợi thế phân phối và nhận diện rất mạnh. Báo cáo năm 2025 của Reuters Institute cho biết ChatGPT vẫn là hệ thống AI tạo sinh được biết đến rộng rãi nhất, không thương hiệu nào khác tiến gần mức nhận diện của ChatGPT [25]. Reuters cũng đưa tin số người dùng hoạt động hằng tuần của OpenAI đã vượt 400 triệu vào tháng 2/2025 [
31].
Nhưng OpenAI không phải bất khả xâm phạm. Reuters dẫn báo cáo của WSJ cho biết tăng trưởng ChatGPT chậm lại vào cuối năm trước, và OpenAI không đạt mục tiêu nội bộ 1 tỷ người dùng hoạt động hằng tuần vào cuối năm [27]. Vì vậy, mối đe dọa lớn nhất từ DeepSeek có lẽ không phải là thay thế thương hiệu ChatGPT ngay lập tức, mà là kéo kỳ vọng giá của thị trường xuống thấp hơn.
Claude/Anthropic: không chỉ là điểm benchmark, mà là quy trình làm việc
DeepSeek gây áp lực trực tiếp lên Claude trong các tác vụ lập trình và suy luận [1][
10]. Nhưng lợi thế của Anthropic không chỉ nằm ở mô hình, mà còn ở cách đóng gói năng lực mô hình thành sản phẩm có độ bám người dùng cao. Reuters đưa tin Claude Code từng khiến OpenAI bất ngờ, buộc OpenAI đổ nguồn lực vào công cụ lập trình Codex của mình [
29].
Điều đó nghĩa là nếu DeepSeek muốn thắng lâu dài trong nhóm nhà phát triển, chỉ có điểm mô hình tốt là chưa đủ. Hãng cần chứng minh mô hình của mình hoạt động tốt trong IDE, tác vụ lập trình kiểu tác nhân, hiểu repo, gỡ lỗi, quản lý quyền doanh nghiệp và cộng tác nhóm — hoặc ít nhất là rẻ hơn đủ nhiều để người dùng chấp nhận chuyển đổi.
Gemini/Google: đối thủ không đứng yên
Gemini đại diện cho một kiểu cạnh tranh khác: sức mạnh nền tảng. Google có lợi thế ở hạ tầng, sản phẩm tiêu dùng, công cụ làm việc và các điểm chạm người dùng mà một mô hình đơn lẻ khó sao chép. Reuters cho biết OpenAI từng tuyên bố trạng thái “code red” vào cuối năm 2025 sau khi Google ra mắt mô hình Gemini mới gây chú ý [29].
Nói cách khác, DeepSeek không chạy đua với một OpenAI đứng yên. Hãng đang bước vào cuộc đua nơi Google, Anthropic và các nhà phát triển mô hình khác đều tăng tốc. Thách thức không chỉ là tạo ra mô hình mạnh, mà là đưa mô hình đó vào hệ sinh thái đủ tiện để người dùng quay lại mỗi ngày: tìm kiếm, văn phòng, đám mây, thiết bị di động, mua sắm doanh nghiệp và công cụ lập trình.
Grok/xAI: chưa đủ dữ liệu để kết luận chắc
Với bộ nguồn hiện có, chưa có đủ so sánh trực tiếp, có thể kiểm chứng giữa DeepSeek và Grok/xAI để kết luận DeepSeek sẽ đánh bại Grok. Cách nói thận trọng hơn là: chiến lược chi phí thấp và mở trọng số của DeepSeek tạo áp lực giá lên toàn bộ thị trường trợ lý AI và API mô hình [10][
12]. Nhưng từ đó nhảy thẳng tới kết luận DeepSeek sẽ thắng Grok thì chưa đủ cơ sở.
Nút thắt lớn nhất: niềm tin dữ liệu và tuân thủ
Khi bước vào chính phủ, tài chính, y tế, pháp lý hoặc các doanh nghiệp lớn, rào cản của DeepSeek có thể không nằm ở năng lực mô hình. Nó nằm ở quản trị dữ liệu, an ninh và niềm tin địa chính trị. Reuters đưa tin cơ quan bảo vệ dữ liệu của Đức đã yêu cầu Apple và Google gỡ DeepSeek khỏi app store tại Đức [73]. Úc cũng cấm DeepSeek trên toàn bộ thiết bị chính phủ vì lo ngại an ninh [
74].
Những động thái này không có nghĩa mô hình DeepSeek vô giá trị, cũng không có nghĩa mọi cách triển khai đều không thể dùng. Nhưng chúng làm quy trình mua sắm trở nên phức tạp hơn. Doanh nghiệp trong ngành bị quản lý chặt không chỉ nhìn giá mỗi triệu token; họ còn xem dữ liệu lưu ở đâu, có nhật ký kiểm toán không, rủi ro chuỗi cung ứng thế nào, kiểm thử bảo mật ra sao, hợp đồng quy định trách nhiệm gì và nhà cung cấp cam kết tuân thủ đến đâu.
Với luồng công việc chứa dữ liệu nhạy cảm, đưa thẳng dữ liệu vào một dịch vụ chat công cộng thường không phải lựa chọn thận trọng nhất. Cách thực tế hơn là phân tầng rủi ro theo từng tác vụ, cân nhắc triển khai riêng, dùng đám mây có kiểm soát, khử định danh dữ liệu và duy trì khả năng chuyển đổi giữa nhiều mô hình.
Nhóm sản phẩm nên làm gì: đừng đặt cược vào một người thắng duy nhất
Chiến lược thực dụng nhất không phải là chọn phe OpenAI, Claude, Gemini, Grok hay DeepSeek. Tốt hơn là xây kiến trúc đa mô hình: đặt các mô hình vào cùng một bộ đánh giá theo tác vụ, rồi đo chất lượng, độ trễ, chi phí, tỷ lệ lỗi, tỷ lệ ảo giác, khả năng quan sát hệ thống và rủi ro dữ liệu trong quy trình thật.
DeepSeek đặc biệt đáng thử sớm trong các tải công việc API khối lượng lớn và nhạy cảm chi phí; các bài toán lập trình, toán, xử lý dữ liệu, sinh nội dung hàng loạt; hệ thống nội bộ cần đánh giá mô hình mở trọng số hoặc tự triển khai; và sản phẩm muốn giảm phụ thuộc vào một nhà cung cấp đóng duy nhất [1][
10][
12][
17].
Ngược lại, các kịch bản cần kiểm soát rủi ro nghiêm ngặt hơn gồm chính phủ, tài chính, y tế, pháp lý, hệ thống chứa nhiều dữ liệu cá nhân; dự án cần yêu cầu rõ về nơi cư trú dữ liệu, kiểm toán, trách nhiệm hợp đồng và cam kết mức dịch vụ; cũng như các quy trình đòi hỏi niềm tin thương hiệu và rà soát tuân thủ cao [73][
74].
Kết luận: DeepSeek có thể không thành vua duy nhất, nhưng sẽ làm thị trường rẻ hơn
DeepSeek có tiềm năng trở thành đối thủ đủ sức thách thức OpenAI, Claude, Gemini và Grok không? Có — nhất là ở các chiến trường như API khối lượng lớn, bài toán nhạy cảm chi phí, lập trình, suy luận và triển khai mô hình mở trọng số [1][
10][
12][
92].
DeepSeek có bằng chứng để nói sẽ sớm đánh bại toàn bộ các ông lớn không? Chưa. Kịch bản hợp lý hơn là DeepSeek tiếp tục đóng vai “người phá giá” và đại diện mạnh của xu hướng mở trọng số: hãng kéo kỳ vọng chi phí xuống, buộc các nhà cung cấp đóng tăng tốc về hiệu quả, công cụ lập trình, trải nghiệm sản phẩm và chính sách giá [10][
12][
29].
Vì vậy, chiến thắng lớn nhất của DeepSeek có thể không phải là trở thành nền tảng AI duy nhất. Chiến thắng đó có thể là làm thị trường mô hình AI rẻ hơn, mở hơn và khó bị kiểm soát hoàn toàn bởi một vài nền tảng đóng. Với doanh nghiệp và nhóm sản phẩm, câu trả lời khôn ngoan không phải là đặt cược tuyệt đối vào một tên tuổi, mà là coi mô hình AI như một lớp cung ứng có thể thay thế — rồi để chính tác vụ, dữ liệu và tiêu chuẩn rủi ro của mình quyết định mô hình nào được đưa vào sản xuất.




