報告已發布2 個月前Last edited 2 個月前24 來源

DeepSeek 會唔會打低 OpenAI、Claude、Gemini、Grok？

DeepSeek 最有殺傷力嘅地方係成本：V3 預訓練用咗 14.8T tokens、2.664M H800 GPU hours，顯示近前沿模型未必一定要由最有錢嘅閉源巨頭壟斷 [17]。 V3 技術報告指 DeepSeek V3 Base 係當時最強開源基礎模型之一，程式同數學尤其突出；IISS 亦形容 R1 嘅推理能力可同 OpenAI o1 等近前沿閉源推理模型相提並論 [1][10]。

使用 Studio Global AI 搜尋並查核事實瀏覽更多熱門頁面

抽象 AI 晶片與多個聊天機器人平台競爭的示意圖，象徵 DeepSeek 挑戰 OpenAI、Claude、Gemini 與 Grok — DeepSeek 會擊敗 OpenAI、Claude、Gemini、Grok 嗎？成本與信任才是關鍵AI 生成示意圖：DeepSeek 與主要 AI 平台的競爭，重點不只模型能力，也包括成本、分發與信任。
AI 提示
Create a landscape editorial hero image for this Studio Global article: DeepSeek 會擊敗 OpenAI、Claude、Gemini、Grok 嗎？成本與信任才是關鍵. Article summary: DeepSeek 有能力成為 AI 巨頭的強競爭者，但目前更像低成本「價格破壞者」而非全面勝者：V3 預訓練約 2.664M H800 GPU hours，R1 被 IISS 描述為可與 OpenAI o1 等近前沿推理模型相提並論；主要變數是企業信任、資料安全與監管 [10][17][73][74]。. Topic tags: ai, deepseek, openai, claude, gemini. Reference image context from search candidates: Reference image 1: visual subject "智通财经APP获悉，DeepSeek大模型以极低成本(600万美元)和少量芯片(2000块)实现了与OpenAI等巨头相媲美的性能，挑战了"唯有科技巨头才能研发尖端AI"的行业共识。" source context "DeepSeek训练成本不到GPT的二十分之一 AI应用或迎来低成本扩张 | Smart Fish Wealthlink Holdings Limited" Reference image 2: visual subject "The image compares the logos of four AI models—Grok 3, Deepseek-V3, Claude 3.5 Sonnet, and Gemini 2.0 Pro—in a split-screen layout, with the question "Who will Win?" superimposed i" Style: premium digital editorial illustration, source-backed resear
openai.com

DeepSeek 係真威脅，但未到可以簡單講「已經打低 OpenAI、Claude、Gemini、Grok」。更準確嘅講法係：DeepSeek 將低成本、開權重、接近前沿能力嘅模型推到主流視野；但如果要變成全球 AI 嘅預設入口，仲要面對分發、企業採購、資料治理同監管信任嘅長期考驗。

先講清楚：咩先叫「打低」？

如果「打低」係指喺部分 benchmark、程式、數學、推理任務上逼近閉源前沿模型，DeepSeek 已經有資格入第一梯隊。DeepSeek-V3 技術報告指，V3-Base 喺綜合評測入面係當時最強開源基礎模型之一，尤其係 code 同 math；其 chat 版本亦喺多項標準同開放式 benchmark 上，接近 GPT-4o 同 Claude-3.5-Sonnet 。

但如果「打低」係指成為全球主流 AI 平台，勝負就唔係一張排行榜可以定生死。真正競爭包括推理成本、API 價格、延遲、產品體驗、企業合約、資料保護、政府合規、開發者生態同消費者品牌。DeepSeek 喺成本同開權重方面好強；但喺全球分發同信任方面，戰場先啱啱開始。

DeepSeek 最犀利：將前沿 AI 嘅成本想像打低

DeepSeek 震撼市場，唔單止因為多咗一個聊天機械人，而係因為佢迫成個行業重新計數：做到接近前沿能力，到底要幾多錢？IISS 指出，DeepSeek-V3 喺 2024 年 12 月發布，R1 喺 2025 年 1 月發布；V3 因效率同較低訓練成本受注目，R1 則因推理能力可同 OpenAI o1 等近前沿閉源推理模型相提並論而受到關注。

DeepSeek 官方 GitHub 說明指，V3 係 671B 總參數、每個 token 啟用 37B 參數嘅模型；預訓練使用 14.8T tokens，花費 2.664M H800 GPU hours 。呢組數字撐起 DeepSeek 最重要嘅敘事：接近前沿嘅模型能力，未必只可以由算力同資本最雄厚嘅閉源巨頭提供。

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

使用 Studio Global AI 搜尋並查核事實

人們還問