| $0.50 |
| $25.00 |
| 1M tokens |
| 128K tokens |
| GPT-5.5 | OpenAI | $5.00 | $0.50 | $30.00 | 短上下文級別;超過約272K token會跳去長上下文附加費 | 128K tokens |
| GPT-5.5 Pro | OpenAI | $30.00 | — | $180.00 | 短上下文級別;超過約272K token會跳去長上下文附加費 | 128K tokens |
| Gemini 3.5 Flash | $1.50 | $0.15 | $9.00 | 1,048,576 tokens | 65,536 tokens |
| Grok 4.3 | xAI | $1.25 | $0.20 | $2.50 | 1M tokens | — |
| DeepSeek V4 Flash | DeepSeek | $0.14 | $0.028 | $0.28 | 1M tokens | 384K tokens |
| DeepSeek V4 Pro | DeepSeek | $1.74 | $0.145 | $3.48 | 1M tokens | 384K tokens |
Claude Opus 4.8 同 4.7 嘅標準價錢同 Opus 4.6 一模一樣,維持住Anthropic自Opus 4.5代以嚟嘅定價策略 。不過,Opus 4.7 引入咗新嘅tokenizer,同樣嘅輸入文字會比起 Opus 4.6 產生多達35%嘅token,雖然每token單價無變,但變相令你實際俾多咗錢
。
GPT-5.5 嘅定價仲有乾坤:一旦你嘅請求超過大約272K token,輸入價錢會即刻加倍、輸出就加1.5倍。呢個分級收費模式好容易殺你一個措手不及,尤其係你無留意自己嘅提示越嚟越長嗰陣 。Grok 4.3 都玩類似嘅招數——標準價只適用於200K token以內嘅請求,一過咗呢個水位,價錢就即刻Double
。
DeepSeek V4 Flash 喺呢班對手入面完全係另一個物種。每百萬token輸入只係0.14美金、輸出0.28美金,輸出價錢比GPT-5.5平咗約97%,輸入價錢仲要平過Grok 4.3近七成,對於高吞吐量嘅Agent工作流程嚟講,呢個價錢係無敵嘅 。
提示快取(Prompt Caching)係最有效嘅慳錢方法。當你嘅提示有共通嘅開頭——例如系統指令或者長對話紀錄——快取咗嘅輸入token就會用折扣價計數。
Anthropic、OpenAI同Google三間喺快取輸入嘅折扣上好一致,全部都做到約九折。DeepSeek嘅V4 Flash快取命中價係0.028美金,比起標準嘅0.14美金平咗八成 。Grok 4.3嘅快取價就定喺每百萬token 0.20美金,適用於200K token以內嘅請求
。對於嗰啲成日重複用相同提示嘅工作流程,呢啲快取級別可以輕鬆將你每月嘅API帳單斬半,甚至斬得更多。
批次API(Batch API)係另一個慳錢大法,通常可以用標準價嘅半價換取較慢嘅處理時間。
上下文視窗嘅大細同最大輸出token數,會直接影響到能力同成本。視窗越大,每次請求嘅輸入token就越多,帳單自然跟住膨脹。
Comments
0 comments