studioglobal
熱門發現
答案已發布9 來源

Claude Opus 4.7 API 收費指南:$5/$25、Prompt Caching 同 Token 點計

Claude Opus 4.7 在 Anthropic API 的基礎收費係每百萬 input tokens $5、output tokens $25;真正成本要另計 prompt caching,而且新 tokenizer 可能令同一文字用約 1x 至 1.35x tokens。[19][20] 最穩陣做法:送出前用 /v1/messages/count tokens 計實際 payload,送出後用 response usage 同 Usage & Cost Admin API 對帳。[16][18] 公式唔應該用「總 tokens × 單價」;input、output、cache write、cache read 要分開...

18K0
Claude Opus 4.7 API 收費表、token 計算與 prompt caching 成本公式的編輯插圖
Claude Opus 4.7 API 收費指南:$5/$25、Token 計法同成本公式AI-generated editorial illustration for Claude Opus 4.7 API pricing and token accounting.
AI 提示

Create a landscape editorial hero image for this Studio Global article: Claude Opus 4.7 API 收費指南:$5/$25、Token 計法同成本公式. Article summary: Claude Opus 4.7 API 基礎價係每百萬 input tokens $5、每百萬 output tokens $25;但 prompt caching 要另計,而且新 tokenizer 可能令同一段文字用大約 1x 至 1.35x token。[19][20]. Topic tags: ai, anthropic, claude, api pricing, llm. Reference image context from search candidates: Reference image 1: visual subject "# Claude Opus 4.7 上线完全指南(2026 最新):核心升级与国内 API 接入方案. **Claude Opus 4.7 于 2026 年 4 月 16 日正式发布,API model ID 为 `claude-opus-4-7`,定价维持与 Opus 4.6 相同的 $5/M 输入 token、$25/M 输出 token 不变,1M t" source context "Claude Opus 4.7 上线完全指南(2026 最新):核心升级与 ..." Reference image 2: visual subject "# Claude Opus 4.7 上线完全指南(2026 最新):核心升级与国内 API 接入方案. **Claude Opus 4.7 于 2026 年 4 月 16 日正式发布,API model ID 为 `claude-opus-4-7`,定价维持与 Opus 4.6 相同的 $5/M 输入 token、$25/M 输出 token 不变,1M t" source context "Claude Opus 4.

openai.com

Claude Opus 4.7 的標價看似簡單,但如果把所有 token 當成同一種收費,成本很快會計錯。Anthropic 表示開發者可用 model ID claude-opus-4-7 經 Claude API 使用 Opus 4.7;以下收費以 Anthropic API pricing 為準,第三方 pricing index 亦列出相同的 $5 input / $25 output per million tokens 起點,但如果經其他平台接入,仍應查該平台的最終帳單。[7][9][19][21]

價格速覽:不只係 $5 同 $25

本文用 MTok 表示 1,000,000 tokens。Anthropic pricing 文件將 Base Input Tokens、Cache Writes、Cache Hits 同 Output Tokens 分開列示,所以實務上亦應分開入帳。[19]

收費項目單價點理解
Base input tokens$5 / MTok一般送入模型、未按 cache write/read 計的輸入 token。[19]
Output tokens$25 / MTokClaude 生成回覆時產生的輸出 token。[19]
Prompt cache write,5 分鐘 TTL$6.25 / MTok第一次寫入可重用 prompt cache,使用 5 分鐘 TTL 時適用。[19]
Prompt cache write,1 小時 TTL$10 / MTok使用 1 小時 TTL 寫入 prompt cache 時適用。[19]
Cache read / hit$0.50 / MTok命中已快取內容並讀取 cache 時適用。[19]

重點係:不要只用「總 tokens」乘一個平均價。Opus 4.7 的 input、output、cache write 同 cache read 單價不同;只要你的 app 有 prompt caching,成本模型就要把幾類 token 拆開。[19]

成本公式:先分清有無 prompt caching

無 prompt caching

最基本公式係:

成本 = input_tokens ÷ 1,000,000 × 5 + output_tokens ÷ 1,000,000 × 25

例如一次 request 有 200,000 input tokens 同 20,000 output tokens,未計 cache 時就是

$1.00 + $0.50 = $1.50
。這只是按 Anthropic API input/output 單價做算術,不包括其他平台費用或供應商差異。[19]

有 prompt caching

有 prompt caching 時,成本應改為逐項相加:

成本 = base_input_tokens ÷ 1,000,000 × 5 + output_tokens ÷ 1,000,000 × 25 + cache_write_5m_tokens ÷ 1,000,000 × 6.25 + cache_write_1h_tokens ÷ 1,000,000 × 10 + cache_read_input_tokens ÷ 1,000,000 × 0.50

如果你只使用一種 cache TTL,就只保留對應的 cache write 項。Anthropic streaming 文件的 usage example 顯示 usage 可包含 input_tokensoutput_tokenscache_creation_input_tokenscache_read_input_tokens 等欄位;pricing 文件亦將 cache write 同 cache hit 分開收費。[15][19]

Token 點計最清楚:送出前用 count_tokens

不要用中文字數、英文字數或大概 character count 去估 API 成本。Anthropic 的 /v1/messages/count_tokens endpoint 是用來在送出 message 前計算 token;文件指它接受與建立 message 類似的結構化輸入,包括 system prompts、tools、images 同 PDFs,並回傳 total input tokens;所有 active models 都支援 token counting。[18]

最穩陣流程是:把實際會送入 Messages API 的 payload 直接送去 count_tokens,包括 system prompt、messages、tools、圖片或 PDF。這樣可以在真正呼叫模型前先估 input token 成本,亦方便你在產品內設定預算上限或預警。[18]

送出後:用 response usage 做真實入帳

Request 完成後,應記錄 API response 入面的 usage,而不是再用輸出文字長度倒推。Anthropic 的 Messages API examples 顯示 response usage 可包含 input_tokensoutput_tokens 等欄位;streaming 文件亦顯示 cache 相關欄位如 cache_creation_input_tokenscache_read_input_tokens[15][17]

如果你用 streaming,要特別小心 dashboard 計法。Anthropic streaming docs 指出,message_delta 入面的 usage token counts 是累積值,不是每個 event 的新增量;如果逐個 delta 直接相加,就會把同一批 token 重複計入。[15]

月結同團隊對帳:用 Usage & Cost Admin API

單次 response log 適合做即時監控,但團隊月結、workspace 分帳或長期成本分析,應再用 Anthropic 的 Usage & Cost Admin API。官方文件指這個 API 提供 programmatic、granular access to historical API usage and cost data,並可按 model、workspace、service tier 等維度拆分 usage report。[16]

換句話講,app 端可以記錄每次 request 的 usage 做產品內成本控制;正式對帳時,仍應以 Usage & Cost Admin API 的歷史 usage/cost 資料作準。[16]

升級到 Opus 4.7 前,要重跑 token budget

Opus 4.7 引入新 tokenizer。Anthropic 文件指出,新 tokenizer 處理文字時,可能使用約 1x 至 1.35x 於 previous models 的 token 數,最高約多 35%,而實際幅度會因內容而異;同一段 input 用 /v1/messages/count_tokens 在 Opus 4.7 同 Opus 4.6 會回傳不同 token number。[20]

所以,「input $5/MTok、output $25/MTok」不等於升級後帳單一定不變。如果你由 Opus 4.6 或更早模型升級,應抽取高流量 prompt、長 context prompt、含 tool definitions 的 payload,以及最貴的 workflow,重新跑一次 /v1/messages/count_tokens,再更新 alert、rate limit 同成本上限。[18][20]

實務核對清單

  • 確認 API model ID 使用 claude-opus-4-7[9]
  • 重要 release 前,用 /v1/messages/count_tokens 對代表性 payload 做預估。[18]
  • input_tokensoutput_tokens、cache write 同 cache read 分開入帳,不要只存一個 total token 數。[15][19]
  • 使用 streaming 時,記住 message_delta.usage 是累積值,不要逐個 event 重複相加。[15]
  • 團隊月結、workspace 分帳或歷史趨勢分析,使用 Usage & Cost Admin API。[16]
  • 由舊版 Claude model 升級到 Opus 4.7 前,重新測試 tokenizer 對實際 prompt 的影響。[20]

總結:Claude Opus 4.7 的 API 基礎價不難記,input $5/MTok、output $25/MTok;真正要計準,就要在送出前用 count_tokens,送出後記錄 usage,並把 prompt caching 同新 tokenizer 的影響納入成本模型。[18][19][20]

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

使用 Studio Global AI 搜尋並查核事實

重點

  • Claude Opus 4.7 在 Anthropic API 的基礎收費係每百萬 input tokens $5、output tokens $25;真正成本要另計 prompt caching,而且新 tokenizer 可能令同一文字用約 1x 至 1.35x tokens。[19][20]
  • 最穩陣做法:送出前用 /v1/messages/count tokens 計實際 payload,送出後用 response usage 同 Usage & Cost Admin API 對帳。[16][18]
  • 公式唔應該用「總 tokens × 單價」;input、output、cache write、cache read 要分開乘單價,streaming 的 message delta.usage 係累積值,不應逐段相加。[15][19]

人們還問

「Claude Opus 4.7 API 收費指南:$5/$25、Prompt Caching 同 Token 點計」的簡短答案是什麼?

Claude Opus 4.7 在 Anthropic API 的基礎收費係每百萬 input tokens $5、output tokens $25;真正成本要另計 prompt caching,而且新 tokenizer 可能令同一文字用約 1x 至 1.35x tokens。[19][20]

首先要驗證的關鍵點是什麼?

Claude Opus 4.7 在 Anthropic API 的基礎收費係每百萬 input tokens $5、output tokens $25;真正成本要另計 prompt caching,而且新 tokenizer 可能令同一文字用約 1x 至 1.35x tokens。[19][20] 最穩陣做法:送出前用 /v1/messages/count tokens 計實際 payload,送出後用 response usage 同 Usage & Cost Admin API 對帳。[16][18]

接下來在實務上我該做什麼?

公式唔應該用「總 tokens × 單價」;input、output、cache write、cache read 要分開乘單價,streaming 的 message delta.usage 係累積值,不應逐段相加。[15][19]

接下來我應該探索哪個相關主題?

繼續“Claude Security 公測版:Anthropic 點樣用 AI 幫企業掃 code 漏洞”以獲得另一個角度和額外的引用。

開啟相關頁面

我應該將其與什麼進行比較?

對照「xAI Grok 4.3 API 解讀:1M context、低 token 價與語音平台野心」交叉檢查此答案。

開啟相關頁面

繼續你的研究

研究對話

研究問題

搜尋及事實查核:Claude Opus 4.7 幾錢?token 點計先最清楚?

Studio Global AI29 來源

引用的答案

如果你講嘅係 Anthropic API,Claude Opus 4.7 官方價目前係每百萬 input tokens 收 $5、每百萬 output tokens 收 $25;如果用 prompt caching,5 分鐘 cache write 係 $6.25/MTok、1 小時 cache write 係 $10/MTok、cache hit/refresh 係 $0.50/MTok。[3] 而且 Opus 4.7 用咗新 tokenizer,官方話同一段固定文字相比舊模型可能會多用最多約 35% tokens,所以「標價冇變」唔代表實際成本一定同舊版一樣。[3][8]

  • 官方 models 頁面列明 Claude Opus 4.7 已經係 generally available,API model ID 係 claude-opus-4-7,定價同上面一致。[2]

  • 最清楚嘅 token 計法,唔好自己估字數,直接用官方 /v1/messages/count_tokens;Anthropic 話呢個 token counting endpoint 接受同 Messages API 一樣嘅結構化輸入,可以喺送出前先計好 input tokens。[9]

  • 送出 request 之後,再睇 API 回傳嘅 usage 欄位;官方文件示例顯示會有 input_tokensoutput_tokens,以及快取相關欄位如 cache_creation_input_tokenscache_read_input_tokens[5]

  • 如果你用 streaming,message_delta 入面見到嘅 usage token counts 係累積值,不是每個 event 單獨新增值。[5]

  • 如果你想對帳最準,官方建議用 Usage & Cost Admin API,因為佢提供歷史 usage 同 cost 資料,並強調可以攞到較精確嘅 token counts,而唔係只靠單次 response 去估。[6]

  • 實際計錢公式,最易記係:

    • 無 cache:
      成本 = (input_tokens / 1,000,000 × $5) + (output_tokens / 1,000,000 × $25)
      [3]
    • 有 cache:再加上 cache_creation_input_tokens 對應 write 價,並把 cache_read_input_tokens 按 $0.50/MTok 去計。[3][5]
  • 例子:如果一次 request 用咗 200,000 input tokens 同 20,000 output tokens,未計 cache 時大約係 $1.00 + $0.50 = $1.50。[3]

  • 要留意,Opus 4.7 新 tokenizer 可能令同一段 prompt 比舊 model 食多 token,所以你如果由 Opus 4.6 轉過去,最好先跑一次 count_tokens 再改 budget。[8][9]

如果你想,我可以下一步直接幫你整一個「Claude Opus 4.7 成本速算表」:輸入 prompt token、output token、cache 有冇開,我即刻幫你計到每次 request 幾錢。

來源

  • [7] Claude Opus 4.7 pricing & specs — Anthropic | CloudPricecloudprice.net

    Claude Opus 4.7. Claude Opus 4.7isAnthropic logoAnthropic's language model with a 1.0M context window and up to 128K output tokens, available from 7 providers, starting at $5.00 / 1M input and $25.00 / 1M output. Canonical ID anthropic-claude-4-7-opus . Ama...

  • [9] Introducing Claude Opus 4.7 - Anthropicanthropic.com

    Skip to main contentSkip to footer. Developers can use claude-opus-4-7 via the Claude API. . . ![Image 5: logo](

  • [15] Streaming Messages - Claude API Docsplatform.claude.com

    event: message startevent: message startdata: {"type":"message start","message":{"id":"msg 01G...","type":"message","role":"assistant","model":"claude-opus-4-6","content":[],"stop reason":null,"stop sequence":null,"usage":{"input tokens":2679,"cache creatio...

  • [16] Usage and Cost API - Claude API Docsplatform.claude.com

    Usage and Cost API. The Usage & Cost Admin API provides programmatic and granular access to historical API usage and cost data for your organization. Leading observability platforms offer ready-to-use integrations for monitoring your Claude API usage and co...

  • [17] Using the Messages API - Claude API Docsplatform.claude.com

    !/bin/sh !/bin/shcurl \ curl \ --header "x-api-key: $ANTHROPIC API KEY" \ --header "x-api-key: $ANTHROPIC API KEY " \ --header "anthropic-version: 2023-06-01" \ --header "anthropic-version: 2023-06-01" \ --header "content-type: application/json" \ --header...

  • [18] Token counting - Claude API Docsplatform.claude.com

    Token counting. Token counting enables you to determine the number of tokens in a message before sending it to Claude, helping you make informed decisions about your prompts and usage. With token counting, you can. How to count message tokens. The token cou...

  • [19] Pricing - Claude API Docsplatform.claude.com

    The "Base Input Tokens" column shows standard input pricing, "Cache Writes" and "Cache Hits" are specific to prompt caching, and "Output Tokens" shows output pricing. Prompt caching multipliers apply on top of fast mode pricing. Fast mode is not available w...

  • [20] What's new in Claude Opus 4.7platform.claude.com

    Claude Opus 4.7 introduces task budgets. This new tokenizer may use roughly 1x to 1.35x as many tokens when processing text compared to previous models (up to 35% more, varying by content), and /v1/messages/count tokens will return a different number of tok...

  • [21] Claude Opus 4.7 API Pricing 2026 - Costs, Performance & Providerspricepertoken.com

    Join the conversation on AI models, pricing, and tools. Price Per TokenPrice Per Token. Claude Opus 4.7 API Pricing 2026. Compare pricing, benchmarks, and providers for Claude Opus 4.7. Pricing starts at $5.00 per million input tokens and $25.00 per million...