studioglobal
熱門探索內容
答案已發布3 個來源

Claude Opus 4.7 API 成本試算:長文件、長對話與批次任務怎麼抓預算

Claude Opus 4.7 API 公開價為 input $5/MTok、output $25/MTok;一次性長文件可直接套公式,但反覆問答與長對話的成本關鍵通常是 prompt caching、cache hit rate 與 tokenizer buffer。[2] Prompt caching 的 5 分鐘寫入為 $6.25/MTok、1 小時寫入為 $10/MTok、cache hit / refresh 為 $0.50/MTok;以 300k 文件為例,第二輪命中約 $0.21,而不是每次約 $1.56 重送全文。[2] 批次任務若尚未確認適用折扣或平台單價,正式預算應先用同步 API 公開價保守估算,再按實際...

15K0
Claude Opus 4.7 API 價格試算與長上下文成本分析示意圖
Claude Opus 4.7 API 價格試算:長文件、長對話與批次任務預算指南長文件與長對話的 API 預算,應拆成 input、output、prompt caching 與安全 buffer 分別估算。
AI 提示詞

Create a landscape editorial hero image for this Studio Global article: Claude Opus 4.7 API 價格試算:長文件、長對話與批次任務預算指南. Article summary: Claude Opus 4.7 API 的基礎價是每百萬 input tokens $5、output tokens $25;一次性任務可直接套公式,但長文件與長對話若會反覆查問,成本關鍵通常是 prompt caching 與 token buffer。[2]. Topic tags: ai, anthropic, claude, api pricing, prompt caching. Reference image context from search candidates: Reference image 1: visual subject "# Claude Opus 4.7 上线完全指南(2026 最新):核心升级与国内 API 接入方案. **Claude Opus 4.7 于 2026 年 4 月 16 日正式发布,API model ID 为 `claude-opus-4-7`,定价维持与 Opus 4.6 相同的 $5/M 输入 token、$25/M 输出 token 不变,1M t" source context "Claude Opus 4.7 上线完全指南(2026 最新):核心升级与 ..." Reference image 2: visual subject "Claude API 定价 2026:Anthropic 最新 Opus、Sonnet、Haiku 成本. | **Claude Opus 4.7** | $5.00 | $25.00 | 最新旗舰,适合复杂编码、智能体和高自治任务 |. | **Claude Opus 4.6** | $5.00 | $25.00 | 上一代旗舰,适合迁移对照和已固定版本部" source context "Claude API 定价2

openai.com

Claude Opus 4.7 的 API 預算,不能只看單次請求多少 tokens。真正容易讓帳單放大的,是長文件或長對話在每一輪都被重新送入模型;如果上下文會重複使用,prompt caching 會成為成本分水嶺。

Anthropic 表示開發者可透過 Claude API 使用 claude-opus-4-7;以下試算只採用 Claude API 公開定價,不含企業合約、雲端平台端點、第三方路由、稅費或匯率差異。[11]

先把官方 MTok 單價算對

Claude API 定價文件以每百萬 tokens,也就是 MTok,列出 Opus 4.7 的 base input、output 與 prompt caching 價格。[2]

計費項目Claude Opus 4.7 公開價
Base input tokens$5 / 1M tokens
Output tokens$25 / 1M tokens
5 分鐘 cache write$6.25 / 1M tokens
1 小時 cache write$10 / 1M tokens
Cache hit / refresh$0.50 / 1M tokens

不用 cache 時,最基本的 API 成本公式是:[2]

text
成本 = input_tokens / 1,000,000 × 5
     + output_tokens / 1,000,000 × 25

使用 prompt caching 時,則要把可重用上下文拆開:第一次寫入 5 分鐘 cache 的部分按 $6.25/MTok,第一次寫入 1 小時 cache 的部分按 $10/MTok,後續 cache hit / refresh 按 $0.50/MTok;未被快取的新問題、新訊息仍按一般 input 價格,模型輸出仍按 output 價格。[2]

一次性長文件分析:直接用 input + output

如果一份文件只分析一次,沒有後續追問,預算最簡單:文件、系統提示與問題都算 input tokens;模型回答算 output tokens。以下範例皆以 Claude API 公開價試算。[2]

情境InputOutput試算成本
較短的長文件摘要100k5k約 $0.625
中大型文件分析300k8k約 $1.70
超大型文件分析1M10k約 $5.25

以 300k input + 8k output 為例:

text
300,000 / 1,000,000 × 5  = 1.50
8,000 / 1,000,000 × 25   = 0.20
合計                       = 1.70 美元

遷移到 Opus 4.7 時,不建議直接沿用舊模型的 token 預估。Anthropic 定價文件註明 Opus 4.7 使用新 tokenizer,同一段固定文字的 token 數最多可能增加 35%。[2]

例如原本估 300k input,保守抓成 405k input;搭配 8k output 時:

text
405,000 / 1,000,000 × 5  = 2.025
8,000 / 1,000,000 × 25   = 0.20
合計                       ≈ 2.23 美元

同一份長文件反覆問答:cache 是分水嶺

長文件產品最常低估的成本,不是單次輸出,而是同一份大文件在每輪對話中反覆作為 input 計費。若文件會被多次查問,應先把 prompt caching 納入預算模型。[2]

假設:

  • 文件:300k tokens
  • 每次新問題:2k tokens
  • 每次回答:2k output tokens
  • 使用 5 分鐘 prompt cache
做法成本組成試算成本
第一次:建立 5 分鐘 cache300k × $6.25/MTok + 2k × $5/MTok + 2k × $25/MTok約 $1.935
後續:cache hit300k × $0.50/MTok + 2k × $5/MTok + 2k × $25/MTok約 $0.21
不用 cache:每次重送全文302k × $5/MTok + 2k × $25/MTok約 $1.56

在這個例子中,第一輪建立 cache 比不用 cache 還貴;但只要同一份文件進入第二輪請求,總成本就低於每次重送全文:

text
不用 cache,兩輪:約 1.56 × 2 = 3.12 美元
用 5 分鐘 cache,兩輪:約 1.935 + 0.21 = 2.145 美元

因此,長文件問答的預算重點是 cache hit rate:文件是否真的會被重複問、追問是否落在 cache 有效期內,以及每輪是否仍帶入大量未快取的新內容。[2]

長對話預算:不要讓歷史訊息每輪重算

長對話的成本邏輯與長文件相同。若應用每輪都把大量歷史訊息送回模型,input 成本會快速累積;可重用且穩定的歷史上下文應優先評估 prompt caching。[2]

假設:

  • 歷史對話:200k tokens
  • 每輪新訊息:1k tokens
  • 每輪輸出:2k tokens
做法試算成本
不用 cache:每輪帶 200k 歷史 + 1k 新訊息 + 2k 輸出約 $1.055 / 輪
先把 200k 歷史寫入 5 分鐘 cache:第一次那輪約 $1.305
5 分鐘 cache hit 後:每輪約 $0.155 / 輪
先把 200k 歷史寫入 1 小時 cache:第一次那輪約 $2.055
1 小時 cache hit 後:每輪約 $0.155 / 輪

選 5 分鐘或 1 小時 cache,不應只看寫入單價,而要看使用者行為:

  • 使用者通常會在 5 分鐘內連續追問:先估 5 分鐘 cache。
  • 使用者常隔超過 5 分鐘才回來,但多半在 1 小時內繼續:1 小時 cache 的第一次寫入較貴,但可能減少反覆失效與重建。
  • 回覆間隔不可預測:先用真實流量抽樣,量 cache hit rate,再調整架構。

批次任務:先用同步公開價抓保守預算

批次任務常見於離線分析、資料標註、批量摘要或大量分類。不過在尚未確認你的帳戶、合約或平台端點適用的 batch pricing 前,正式預算不應先寫入未核實折扣。保守做法是先按同步 API 公開價估算,再用實際確認的批次價格下修。[2]

同步公開價公式仍然是:

text
總成本 = 總 input tokens / 1,000,000 × 5
       + 總 output tokens / 1,000,000 × 25

例:10,000 筆任務,每筆 2k input + 500 output。

text
總 input  = 10,000 × 2,000 = 20,000,000 tokens
總 output = 10,000 × 500   = 5,000,000 tokens

input 成本  = 20 × 5  = 100 美元
output 成本 = 5 × 25  = 125 美元
合計         = 225 美元

這個 $225 是不計入任何 batch discount 的保守同步價估算。若後續確認有適用的批次價格,再把單價替換成實際價格即可。

另外,如果不是直連 Anthropic Claude API,而是透過雲端平台或第三方模型路由商,實際帳單可能不同。第三方資料 CloudPrice 列出 Opus 4.7 在 Anthropic / global 類型為 $5 input / $25 output per MTok,也列出部分 AWS Bedrock 區域型代碼為 $5.50 input / $27.50 output per MTok;這類資料適合作為檢查提醒,正式採購仍應以你的平台帳務頁、合約與官方文件為準。[12]

實務 buffer:別只看理論值

如果還沒有真實 token 分布,純用理論值通常偏樂觀。至少要把三件事納入安全墊:

  1. Tokenizer 遷移風險:Opus 4.7 的新 tokenizer 可能讓固定文字 token 數最多增加 35%。[2]
  2. Cache hit rate 不確定性:快取只有在上下文真的被重複使用、且仍在有效期內時,才會顯著降低成本。[2]
  3. 實際使用行為:使用者可能要求更長輸出、反覆重試、上傳更大文件,或讓對話歷史超出原本假設。

可用的非官方預算安全墊如下:

階段建議預算係數
PoC / 試跑理論值 × 1.2 到 1.5
正式上線、流量穩定理論值 × 1.35 到 1.6
從舊模型遷移到 Opus 4.7,且大量依賴長上下文理論值 × 1.5 到 1.8

這些係數不是 Anthropic 官方報價,而是預算管理上的保守抓法;正式上線後,應用實際 token 日誌、cache hit rate 與發票資料回填模型。

快速預算模板

沒有 cache 時,可以先用月成本公式:

text
月成本 ≈ 每日請求數 × 30
       × (平均 input tokens / 1,000,000 × 5
          + 平均 output tokens / 1,000,000 × 25)

有 cache 時,務必拆開算:

text
月成本 ≈ 一般 input 成本
       + cache write 成本
       + cache hit / refresh 成本
       + output 成本

實作前至少填入這些變數:

變數例子
每次平均 input tokens300,000
每次平均 output tokens8,000
每日請求數1,000
Cache write tokens每份文件 300,000
Cache hit tokens每次命中 300,000
Cache hit rate60%
Tokenizer 遷移 buffer最高先抓 × 1.35
營運 buffer例如 × 1.35 到 1.6

最後怎麼抓預算

一次性長文件分析,直接用 $5/MTok input + $25/MTok output 估算即可。[2]

同一份長文件反覆問答,或長對話每輪都帶大量歷史,應先試算 prompt caching;在 300k 文件、2k 問題、2k 輸出的例子中,5 分鐘 cache 第二輪命中約 $0.21,而每次重送全文約 $1.56。[2]

批次任務先用同步 API 公開價抓保守預算,等你確認實際 batch pricing、雲端平台價格或合約單價後再下修。若是從舊模型遷移到 Opus 4.7,先把 input token 預估乘上最高 1.35,再加上營運 buffer,會比只看標價更接近真實帳單。[2]

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

使用 Studio Global AI 搜尋並查證事實

重點整理

  • Claude Opus 4.7 API 公開價為 input $5/MTok、output $25/MTok;一次性長文件可直接套公式,但反覆問答與長對話的成本關鍵通常是 prompt caching、cache hit rate 與 tokenizer buffer。[2]
  • Prompt caching 的 5 分鐘寫入為 $6.25/MTok、1 小時寫入為 $10/MTok、cache hit / refresh 為 $0.50/MTok;以 300k 文件為例,第二輪命中約 $0.21,而不是每次約 $1.56 重送全文。[2]
  • 批次任務若尚未確認適用折扣或平台單價,正式預算應先用同步 API 公開價保守估算,再按實際合約或雲端平台價格修正。

大家也會問

「Claude Opus 4.7 API 成本試算:長文件、長對話與批次任務怎麼抓預算」的簡短答案是什麼?

Claude Opus 4.7 API 公開價為 input $5/MTok、output $25/MTok;一次性長文件可直接套公式,但反覆問答與長對話的成本關鍵通常是 prompt caching、cache hit rate 與 tokenizer buffer。[2]

最值得優先驗證的重點是什麼?

Claude Opus 4.7 API 公開價為 input $5/MTok、output $25/MTok;一次性長文件可直接套公式,但反覆問答與長對話的成本關鍵通常是 prompt caching、cache hit rate 與 tokenizer buffer。[2] Prompt caching 的 5 分鐘寫入為 $6.25/MTok、1 小時寫入為 $10/MTok、cache hit / refresh 為 $0.50/MTok;以 300k 文件為例,第二輪命中約 $0.21,而不是每次約 $1.56 重送全文。[2]

接下來在實務上該怎麼做?

批次任務若尚未確認適用折扣或平台單價,正式預算應先用同步 API 公開價保守估算,再按實際合約或雲端平台價格修正。

下一步適合探索哪個相關主題?

繼續閱讀「Claude Security 公測版:Anthropic 的企業程式碼漏洞掃描工具」,從另一個角度查看更多引用來源。

開啟相關頁面

我應該拿這個和什麼比較?

將這個答案與「Grok 4.3 API 解讀:1M 上下文、低 token 價格,xAI 想搶下哪個入口?」交叉比對。

開啟相關頁面

繼續深入研究

研究對話

研究問題

搜尋並查核事實:Claude Opus 4.7 的 API 價格怎麼算?長文件、長對話、批次任務預算要抓多少?

Studio Global AI12 個來源

附引用的答案

我查到的官方 Claude API 定價是:Claude Opus 4.7 為每百萬 input tokens $5、每百萬 output tokens $25,且官方公告明說它的價格與 Opus 4.6 相同。[2][11] 如果你要抓預算,我會用「同步 API 單價 + Opus 4.7 最多 35% tokenizer 膨脹 + 是否用 prompt caching」這三件事來算;批次任務的精確折扣百分比,這次我無法從已抓到的官方內容中可靠抽出,所以保守預算先不要把未驗證折扣算進去。 [2]

  • 官方單價怎麼算

    • 同步 Messages API:費用 = input tokens ÷ 1,000,000 × $5 + output tokens ÷ 1,000,000 × $25。[2]
    • Prompt caching 5 分鐘寫入:cached 部分改按 $6.25/MTok 計;1 小時寫入:$10/MTok;之後 cache hit / refresh:$0.50/MTok。[2]
    • Anthropic 也註明 Opus 4.7 換了新 tokenizer,同一段固定文字的 token 數最多可能比先前模型多 35%。[2]
  • 長文件預算怎麼抓

    • 單次分析 100k input + 5k output,約 $0.625。[2]
    • 單次分析 300k input + 8k output,約 $1.70。[2]
    • 單次分析 1M input + 10k output,約 $5.25。[2]
    • 如果你是從較舊的 Opus 版本升上來,想抓保守值,可先把 input token 預估乘 1.35;例如原本估 300k input,保守抓成 405k input,搭配 8k output 時約 $2.23。[2]
  • 長文件反覆問答,該不該用 cache

    • 例:300k token 文件,第一次建立 5 分鐘 cache,再加 2k 新問題與 2k 輸出,約 $1.935。[2]
    • 同一份文件在 cache 命中時,再問一次 2k 新問題、拿 2k 輸出,約 $0.21。[2]
    • 所以只要同一大文件會被反覆查問 2 次以上,prompt caching 通常就很值得。[2]
  • 長對話預算怎麼抓

    • 例:你每輪都帶 200k 歷史對話,再加 1k 新訊息,模型輸出 2k;如果不用 cache,每輪約 $1.055。[2]
    • 若先把那 200k 歷史做 5 分鐘 cache,第一次寫入那輪約 $1.305;之後命中 cache 的每輪約 $0.155。[2]
    • 如果使用者回覆間隔常超過 5 分鐘、但通常不超過 1 小時,1 小時 cache 可能更合理;同樣 200k 歷史的第一次寫入約 $2.055,之後命中時每輪仍約 $0.155。[2]
  • 批次任務預算怎麼抓

    • 精確 batch discount:Insufficient evidence。這次我沒辦法從已抓到的官方頁面內容中可靠核出折扣百分比,所以不建議你先把某個未驗證折扣寫進正式預算。
    • 保守抓法:先完全按同步 API 單價編列,之後若你再核到官方 batch 折扣,再把預算下修。
    • 例:10,000 筆任務,每筆 2k input + 500 output,先按同步價抓約 $225。[2]
    • 如果你不是直連 Claude API,而是走 AWS Bedrock / Vertex AI 的 regional 或 multi-region endpoint,官方定價頁說這類端點可能比 global endpoint 再貴 10%;Claude API 第一方預設是 global。[2]
  • 我會怎麼抓實務 buffer

    • PoC / 試跑:用理論值 × 1.2 到 1.5。
    • 正式上線但流量穩定:用理論值 × 1.35 到 1.6。
    • 從舊模型遷移到 Opus 4.7、又大量依賴長上下文:先用理論值 × 1.5 到 1.8,因為 tokenizer 膨脹會直接放大 input 成本。[2]
  • 一個簡單結論

    • 一次性長文件分析,直接用 $5 / $25 算就好。[2]
    • 長文件反覆追問、長對話多輪往返,一定要把 prompt caching 算進架構,不然成本會被重複送入的歷史內容吃掉。[2]
    • 批次任務若你現在就要簽核預算,先按「沒有 batch 折扣」抓最安全。

如果你要,我下一則可以直接幫你做一個「輸入文件大小、每輪對話長度、每日任務量」的 Opus 4.7 預算試算表。

來源

  • [2] Pricing - Claude API Docsplatform.claude.com

    The "Base Input Tokens" column shows standard input pricing, "Cache Writes" and "Cache Hits" are specific to prompt caching, and "Output Tokens" shows output pricing. Prompt caching multipliers apply on top of fast mode pricing. Fast mode is not available w...

  • [11] Introducing Claude Opus 4.7 - Anthropicanthropic.com

    Skip to main contentSkip to footer. Developers can use claude-opus-4-7 via the Claude API. . . ![Image 5: logo](

  • [12] Anthropic.Claude Opus 4 7 Pricing & Specs | AI Models | CloudPricecloudprice.net

    Claude Opus 4.7is a textmodel fromAWS Bedrock logoAWS Bedrock with a context window of 1.0M tokens and max output of 128K tokens. claude-opus-4-7 Anthropic logoAnthropic Text 5.00 25.00 1.0M 128K yes yes . anthropic.claude-opus-4-7 AWS Bedrock logoAWS Bedro...