答案已發布6 天前Last edited 前天20 個來源

Qwen3.7 Max、DeepSeek V4、Kimi K2.6 終極對決：哪個AI模型最值得花錢？

Qwen3.7 Max在終端機操作與數學推理領先，但價格最高；DeepSeek V4 Pro Max稱霸純程式碼競賽，且價格極具破壞力。 Kimi K2.6 Thinking在需要搭配工具的長篇軟體工程任務上表現最強，是代理式AI的實戰王者。

422K0

為了讓你快速掌握這三款在2026年第二季備受矚目的大型語言模型（LLM），我們直接將所有關鍵的基準測試分數與API定價整理成清晰表格，一目了然。

一、軟體工程與代理式編碼能力

這三款模型在真實世界的複雜軟體開發任務上，表現都非常接近。但若細分它們的長處，就能看出各自適合的戰場。

基準測試項目	Qwen3.7-Max	DeepSeek V4 Pro Max	Kimi K2.6 Thinking
SWE-Bench Verified	80.4	80.6	80.2

Studio Global AI

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Qwen3.7 Max在終端機操作與數學推理領先，但價格最高；DeepSeek V4 Pro Max稱霸純程式碼競賽，且價格極具破壞力。

DeepSeek以永久75折的價格戰改寫市場規則，每百萬輸出Token僅需新台幣約28元，並開放原始碼供自行部署。

0 comments

Loading comments...

基準測試項目	Qwen3.7-Max	DeepSeek V4 Pro Max	Kimi K2.6 Thinking
AA 智能指數 v4.0	56.6 (#5)	52.0	—
GPQA Diamond	92.4	—	—
HLE (人類最後的考試)	41.4	37.7	54.0 (搭配工具)
HMMT 2026 (數學)	97.1%	95.2%	92.7%
AIME 2026	—	—	96.4%
中國 SimpleQA	—	84.4	75.9
DeepSearchQA (F1)	—	—	92.5

計費項目	Qwen3.7-Max	DeepSeek V4 Pro	Kimi K2.6
輸入 (未命中快取)	$2.50	$1.74（優惠價後為 $0.435）	$0.95
輸出	$7.50	$3.48（優惠價後為 $0.87）	$4.00
快取命中 (輸入)	$0.25 (節省90%)	$0.0145 (節省99%)	$0.16 (節省83%)
上下文視窗	1M tokens	1M tokens	256K tokens
最大輸出長度	65,536 tokens	384,000 tokens	—
開源權重	否 (僅API)	是 (Hugging Face)	是