DeepSeek 係真威脅,但未到可以簡單講「已經打低 OpenAI、Claude、Gemini、Grok」。更準確嘅講法係:DeepSeek 將低成本、開權重、接近前沿能力嘅模型推到主流視野;但如果要變成全球 AI 嘅預設入口,仲要面對分發、企業採購、資料治理同監管信任嘅長期考驗 [10][
73][
74]。
先講清楚:咩先叫「打低」?
如果「打低」係指喺部分 benchmark、程式、數學、推理任務上逼近閉源前沿模型,DeepSeek 已經有資格入第一梯隊。DeepSeek-V3 技術報告指,V3-Base 喺綜合評測入面係當時最強開源基礎模型之一,尤其係 code 同 math;其 chat 版本亦喺多項標準同開放式 benchmark 上,接近 GPT-4o 同 Claude-3.5-Sonnet [1]。
但如果「打低」係指成為全球主流 AI 平台,勝負就唔係一張排行榜可以定生死。真正競爭包括推理成本、API 價格、延遲、產品體驗、企業合約、資料保護、政府合規、開發者生態同消費者品牌。DeepSeek 喺成本同開權重方面好強;但喺全球分發同信任方面,戰場先啱啱開始。
DeepSeek 最犀利:將前沿 AI 嘅成本想像打低
DeepSeek 震撼市場,唔單止因為多咗一個聊天機械人,而係因為佢迫成個行業重新計數:做到接近前沿能力,到底要幾多錢?IISS 指出,DeepSeek-V3 喺 2024 年 12 月發布,R1 喺 2025 年 1 月發布;V3 因效率同較低訓練成本受注目,R1 則因推理能力可同 OpenAI o1 等近前沿閉源推理模型相提並論而受到關注 [10]。
DeepSeek 官方 GitHub 說明指,V3 係 671B 總參數、每個 token 啟用 37B 參數嘅模型;預訓練使用 14.8T tokens,花費 2.664M H800 GPU hours [17]。呢組數字撐起 DeepSeek 最重要嘅敘事:接近前沿嘅模型能力,未必只可以由算力同資本最雄厚嘅閉源巨頭提供。
價錢同樣關鍵。DeepSeek 官方 API 文件以每百萬 token 計價,並分開 cache hit、cache miss 同輸出 token;文件亦顯示模型命名同價格機制可能會調整,所以正式採購仍然要以官方價格頁為準 [12]。對高用量 API、檢索增強生成(RAG)、批量摘要、資料清理、客服草稿、內部 coding assistant 呢類場景嚟講,只要模型質素過到可用門檻,成本、延遲同穩定性往往比單次回答有幾「靚」更重要。
能力好強,但唔好迷信單一榜單
DeepSeek 公開最突出嘅強項,集中喺程式、數學同推理。V3 技術報告將程式同數學列為突出項目 [1];IISS 亦形容 R1 係具備推理能力、可同 OpenAI o1 等近前沿閉源推理模型相提並論嘅開權重模型 [
10]。Reuters 喺 2025 年 3 月報道 DeepSeek 發布模型升級時,亦用「加劇同 OpenAI 競爭」去描述其影響 [
92]。
不過,呢啲唔等於 DeepSeek 喺所有場景都贏。創意寫作、長文件協作、多模態產品、工具調用穩定性、內容安全、企業整合、合規責任,都要放入真實工作流逐項測試。對產品團隊而言,問題唔係「邊個模型總榜第一」,而係「邊個模型喺我嘅任務入面,用最低可接受風險,交到最多成功輸出」。
爆紅係市場衝擊,但唔等於長期勝利
DeepSeek 爆紅已經造成實際市場震盪。CNBC 報道,DeepSeek 喺 2025 年 1 月取代 ChatGPT,登上美國 Apple App Store 免費 App 下載榜首 [96]。Reuters 回顧亦指,DeepSeek 2025 年 1 月初始發布引發全球科技股拋售,令 Nvidia 市值蒸發 5,930 億美元 [
30]。
呢啲事件證明,「低成本前沿級 AI」呢個故事足以震動投資者、開發者同一般用戶。但下載榜同股市反應係熱度訊號,唔係平台勝利。Reuters 2026 年報道 DeepSeek 新模型未有喺快速變化嘅 AI 行業再次令市場驚艷,提醒外界:AI 競賽門檻會一路升,一次震撼唔代表每一代都可以保持領先 [26]。
對幾大對手,DeepSeek 真正威脅喺邊?
OpenAI:壓力最大,但護城河都最深
OpenAI 面對 DeepSeek 嘅價格同效率壓力最直接。不過,OpenAI 仍然有明顯品牌同分發優勢。Reuters Institute 2025 年報告指出,ChatGPT 仍係最廣為人知嘅生成式 AI 系統,冇其他品牌接近其辨識度 [25]。Reuters 亦報道,OpenAI 喺 2025 年 2 月嘅週活躍用戶已經超過 4 億 [
31]。
但 OpenAI 唔係冇壓力。Reuters 轉述 WSJ 報道稱,ChatGPT 成長喺前一年年底放緩,OpenAI 未達內部設定嘅 10 億週活躍用戶目標 [27]。DeepSeek 對 OpenAI 最大威脅,未必係短期取代 ChatGPT 品牌,而係用低成本同開權重選項,壓低市場對 AI 價格嘅預期。
Claude / Anthropic:唔只鬥模型,仲要鬥工作流
DeepSeek 喺 coding 同推理任務上嘅表現,會直接壓到 Claude [1][
10]。但 Anthropic 嘅競爭力唔只係模型分數,仲在於將模型能力包裝成高黏性產品。Reuters 報道,Claude Code 曾令 OpenAI 措手不及,迫使 OpenAI 投入自身 coding tool Codex [
29]。
換言之,DeepSeek 如果想長期贏開發者市場,唔可以只靠 benchmark 接近;佢要喺 IDE、agentic coding、企業權限、repo 理解、debug 流程同團隊協作入面,證明自己更好用或者更抵用。
Gemini / Google:DeepSeek 面對嘅係平台巨頭反擊
Google Gemini 代表另一種壓力:龐大產品入口同基礎設施整合。Reuters 報道,OpenAI 喺 2025 年底因 Google 最新 Gemini 模型進展而宣布「code red」[29]。即係話,DeepSeek 面對嘅唔係一個靜止嘅 OpenAI,而係 Google、Anthropic 同其他模型公司一齊高速迭代。
對 DeepSeek 嚟講,挑戰唔止係做出強模型,仲要將模型放入可以長期留住用戶嘅產品同生態:搜尋、辦公、雲端、手機、企業採購、開發者工具,全部都係戰場。
Grok / xAI:現有來源唔夠支持強結論
就目前呢組來源而言,DeepSeek 同 Grok / xAI 之間缺乏足夠直接、可核驗比較資料。所以較負責任嘅講法係:DeepSeek 嘅低成本同開權重策略,會對整個 AI 助手同 API 市場形成價格壓力 [10][
12];但唔應該單靠現有資料就斷言 DeepSeek 一定會擊敗 Grok。
最大短板:企業信任、資料安全同監管合規
DeepSeek 如果要進入政府、金融、醫療、法律同大型企業場景,最大阻力未必係模型能力,而係資料治理同地緣政治信任。Reuters 報道,德國資料保護主管機關要求 Apple 同 Google 將 DeepSeek 從德國 app store 移除 [73]。澳洲亦因安全疑慮,禁止政府裝置使用 DeepSeek [
74]。
呢啲限制唔代表 DeepSeek 模型冇價值,亦唔等於所有部署都不可行。但對受監管行業嚟講,採購流程會完全唔同:佢哋唔只睇每百萬 token 幾錢,仲會睇資料儲存地、審計紀錄、供應鏈風險、資安測試、合約責任同合規承諾。涉及敏感資料嘅工作流,直接用公共聊天服務通常唔係最穩陣;私有化部署、受控雲端、資料脫敏同多模型風險分級會更實際。
產品團隊點做?唔好押單一贏家
最務實嘅策略唔係選邊站,而係建立多模型架構。將 DeepSeek、OpenAI、Claude、Gemini、Grok 放入同一套任務級評測同路由系統,按實際工作流比較品質、延遲、成本、失敗率、幻覺率、可觀測性同資料風險。
DeepSeek 特別值得優先測試嘅場景包括:高用量而成本敏感嘅 API 工作負載;程式、數學、資料處理同批量生成;需要開權重或自部署評估嘅內部系統;以及想降低單一閉源供應商鎖定風險嘅產品 [1][
10][
12][
17]。
相反,需要更嚴格風控嘅場景包括:政府、金融、醫療、法律同大量個人資料部署;需要明確資料 residency、審計、企業合約責任同長期 SLA 嘅專案;以及對品牌信任同合規審查要求好高嘅工作流 [73][
74]。
結論:DeepSeek 未必做唯一王者,但會令 AI 更平、更開放
DeepSeek 會唔會成為有潛力擊敗 OpenAI、Claude、Gemini、Grok 嘅競爭者?會。至少喺成本敏感、高用量 API、程式與推理、開權重部署呢幾個戰場,DeepSeek 已經足以令巨頭重新定價同加速回應 [1][
10][
12][
92]。
但佢會唔會喺短中期全面擊敗所有巨頭?目前證據未夠。更可能嘅路徑係:DeepSeek 長期扮演「價格破壞者」同「開權重前沿代表」——壓低市場對模型成本嘅預期,亦迫使閉源巨頭喺效率、開發者工具同產品包裝上繼續加速 [10][
12][
29]。
DeepSeek 最大勝利未必係成為唯一王者,而係令 AI 模型市場變得更平、更開放,亦更難由少數閉源平台完全掌控。對企業同產品團隊嚟講,理性答案唔係押 OpenAI、Claude、Gemini、Grok 或 DeepSeek 其中一邊,而係將模型當成可替換供應層,用自己嘅任務、資料同風險標準決定邊個應該上線。




