2025 年初,DeepSeek-R1 一推出,好多人第一反應係:中國 AI 係咪突然追上嚟?US News 報導,R1 在 2025 年 1 月發布後令市場意外,DeepSeek 亦聲稱它比 OpenAI 類似模型更具成本效益;R1 因而很快成為中國追趕美國 AI 技術進展的象徵 [5]。
不過,如果只用「突然變勁」去概括,就會睇漏咗更重要嘅背景。DeepSeek 似係一盞聚光燈,令外界一下子見到中國 AI 多年累積:人才、工程能力、開源策略、成本控制、應用場景同政策投入,早已一齊推緊呢件事。
先講結論:強在開源、成本,同用得落
今輪中國 AI 最突出的地方,不是每一個模型都在所有任務上贏晒美國閉源模型,而是三件事:開源/開放模型擴散得快、成本效率成為核心賣點,而且更容易進入實際產品同產業流程 [1][
3][
5]。
《紐約時報》報導,DeepSeek 將模型以開源方式發布,即其他人可以自由使用同修改;相反,OpenAI 同 Anthropic 的領先模型仍採用專有、閉源路線。該報導亦指出,DeepSeek 事件顯示開源系統可以接近閉源版本的表現 [3]。
但這不等於中國 AI 已經全面領先。CSIS 引述中國研究者的說法指出,中國仍無法取得最先進的晶片製程技術;The Decoder 對 Stanford 分析的報導亦提到,美國政府中心 CAISI 的測試發現,DeepSeek 模型平均比可比較的美國模型更容易受到越獄攻擊 [7][
11]。
1. 人才池已經夠厚
DeepSeek 不是孤立事件。CSIS 指出,中國研究者多年來已經在多個 AI 研究領域達到或接近世界級水平;DeepSeek 則是中國大型 AI 實驗室第一次被全球廣泛視為前沿競爭者 [7]。
Stanford HAI 亦在 2025 年 5 月發布針對 DeepSeek 人才基礎的政策分析,顯示人才來源同培養方式,已成為理解其競爭力的重要問題 [2]。換言之,DeepSeek 的突破不是單一公司撞彩,而是長期研究同工程人才累積之後,終於被全球市場看見。
2. 晶片限制,反而令工程效率變成主戰場
美國晶片出口管制,是中國 AI 發展不能迴避的背景。CSIS 引述中國工程院院士李國傑在 2025 年 2 月 13 日的說法稱,由於美國政府封鎖,中國目前無法取得最先進的晶片製程技術 [7]。
這不應簡化成「被限制就一定突破」。因果關係冇咁直線。但當最先進算力更難取得,訓練效率、推理成本、部署效率就會變得更關鍵。DeepSeek-R1 的震撼力,正正來自這個敘事:它不只展示模型能力,還主張自己比 OpenAI 類似模型更具成本效益 [5]。
3. 開源策略,將影響力放到最大
DeepSeek 的關鍵不只在於模型本身,還在於它點樣發布。《紐約時報》指出,DeepSeek 的開源路線,與 OpenAI、Anthropic 的閉源路線形成鮮明對比 [3]。
開源會改變擴散速度。研究者、開發者同企業不一定要等單一 API 或單一供應商,而可以更快測試、修改、微調同導入模型。同一篇報導亦指出,在 DeepSeek 之後數個月,中國公司發布了數十個其他開源模型;到 2025 年底,這些模型已在全球 AI 使用中佔有顯著份額 [3]。
4. 成本紀律,降低採用門檻
前沿 AI 競爭不只是鬥最高分、鬥最強 benchmark,還要鬥能否以合理成本穩定運行。DeepSeek-R1 在 2025 年初引發關注,正因為它將「能力」同「成本」放在同一個故事入面:DeepSeek 主張 R1 比 OpenAI 類似模型更具成本效益 [5]。
對企業來講,這會改變採購邏輯。如果開源模型在部分任務上接近閉源模型,企業自然會重新評估:是否一定要依賴單一閉源供應商 [3]?
當然,成本優勢不能只看發布時的宣稱。不同任務、延遲要求、安全要求、私有化部署方式、維運能力同授權條款,都會影響最後總成本。
5. 應用生態,令模型更快變成產品
INSEAD 將 DeepSeek 放在中國 AI 生態崛起的大背景下分析,並指出中國已建立能挑戰美國主導地位的強大 AI 生態 [1]。RAND 亦用全棧框架分析中國 AI 產業政策,提醒讀者不要只盯住單一模型公司,而要看更完整的產業能力 [
8]。
這種生態的價值在於:當模型去到「可用」門檻,它更容易被放入產品、流程同產業場景裏面反覆測試。中國 AI 的競爭,因此不只是聊天機械人之爭,而是模型能力、部署能力、產業場景同政策資源之間的組合競爭 [1][
8]。
6. 政策投入同市場競爭,推高迭代速度
中國政府多年來將 AI 視為戰略產業。RAND 將中國 AI 產業政策描述為持續演進的全棧式政策,涵蓋的不只是單一模型,而是更完整的產業能力 [8]。
DeepSeek-R1 之後,政策信心亦更明顯。Carnegie 的分析指出,DeepSeek-R1 在 2025 年初改變了全球 AI 格局,也令中國領導層對本國 AI 發展更有信心;其後,中國領導層邀請 AI 先行者參與高層會議,鼓勵地方政府加速 AI 在關鍵基礎設施中的部署,並承諾完善 AI 法律與政策 [10]。
同時,開源模型之間的競爭本身亦會推動迭代。《紐約時報》報導稱,DeepSeek 之後中國公司發布了數十個其他開源模型;這種密集競爭,會迫使模型公司降低使用門檻、改善部署便利性,並更快回應開發者需求 [3]。
不過要冷靜:中國 AI 仍有三個短板
第一,先進晶片仍是瓶頸。 中國模型團隊在效率上進步很快,但 CSIS 引述中國研究者的說法指出,中國仍無法取得最先進的晶片製程技術 [7]。
第二,開源追近,不等於全面超越閉源。 《紐約時報》報導的是開源系統可以接近閉源版本,而不是證明中國模型已經在所有前沿任務上勝出;OpenAI 與 Anthropic 的領先模型仍然是專有系統 [3]。
第三,安全同治理仍要驗證。 The Decoder 對 Stanford 分析的報導稱,CAISI 測試發現 DeepSeek 模型平均比可比較的美國模型更容易受到越獄攻擊,倍數為 12 倍 [11]。
對企業同開發者有咩實際意思?
中國 AI 崛起最直接的影響,是模型選項變多。開源模型令測試、修改同導入更容易評估;成本效率敘事亦迫使企業重新思考模型採購同技術選型 [3][
5]。
實務上,國別標籤不如任務測試重要。揀模型時,應該:
- 用自己的資料、語言同任務做基準測試,不要只看公開排行榜。
- 同時評估能力、延遲、穩定性、總成本、授權條款同部署方式。
- 高風險場景要做越獄同安全測試,尤其是面向外部用戶或處理敏感資料時 [
11]。
- 如果業務依賴高端算力或特定硬件供應鏈,就要將晶片限制納入風險評估 [
7]。
底線
DeepSeek 不是中國 AI 變強的唯一原因,而是令外界集中看見這些累積的引爆點。中國 AI 看起來突然變勁,是因為多個條件同時去到臨界:人才變厚、算力限制令效率更重要、開源策略放大擴散、成本紀律降低採用門檻,而應用生態同政策資源又提供長期支撐 [1][
2][
3][
5][
7][
8][
10]。
更準確的判斷是:中國 AI 在開源模型、成本效率同快速落地上,已經非常有競爭力;但在最先進晶片、部分閉源前沿能力、安全評估同全球信任上,仍然需要繼續驗證 [3][
7][
11]。




