studioglobal
熱門發現
答案已發布9 來源

Claude Opus 4.7 API-Kosten richtig kalkulieren

In der Anthropic API liegt der Basispreis für Claude Opus 4.7 bei 5 US Dollar pro Mio. Kosten sollten nicht als Gesamt Tokens mal Einheitswert kalkuliert werden: Input, Output, Cache Writes und Cache Reads brauchen eigene Zeilen.[15][19] Vor dem Request hilft /v1/messages/count tokens, nach dem Request die usage Ang...

18K0
Claude Opus 4.7 API 收費表、token 計算與 prompt caching 成本公式的編輯插圖
Claude Opus 4.7 API 收費指南:$5/$25、Token 計法同成本公式AI-generated editorial illustration for Claude Opus 4.7 API pricing and token accounting.
AI 提示

Create a landscape editorial hero image for this Studio Global article: Claude Opus 4.7 API 收費指南:$5/$25、Token 計法同成本公式. Article summary: Claude Opus 4.7 API 基礎價係每百萬 input tokens $5、每百萬 output tokens $25;但 prompt caching 要另計,而且新 tokenizer 可能令同一段文字用大約 1x 至 1.35x token。[19][20]. Topic tags: ai, anthropic, claude, api pricing, llm. Reference image context from search candidates: Reference image 1: visual subject "# Claude Opus 4.7 上线完全指南(2026 最新):核心升级与国内 API 接入方案. **Claude Opus 4.7 于 2026 年 4 月 16 日正式发布,API model ID 为 `claude-opus-4-7`,定价维持与 Opus 4.6 相同的 $5/M 输入 token、$25/M 输出 token 不变,1M t" source context "Claude Opus 4.7 上线完全指南(2026 最新):核心升级与 ..." Reference image 2: visual subject "# Claude Opus 4.7 上线完全指南(2026 最新):核心升级与国内 API 接入方案. **Claude Opus 4.7 于 2026 年 4 月 16 日正式发布,API model ID 为 `claude-opus-4-7`,定价维持与 Opus 4.6 相同的 $5/M 输入 token、$25/M 输出 token 不变,1M t" source context "Claude Opus 4.

openai.com

Auf dem Papier wirkt die Claude-Opus-4.7-API-Preisfrage einfach: Anthropic nennt als Modell-ID claude-opus-4-7, nutzbar über die Claude API.[9] Die eigentliche Kostenrechnung wird aber erst sauber, wenn Input, Output, Prompt Cache und Tokenizer getrennt betrachtet werden.

Die folgenden Werte beziehen sich auf die Anthropic API. Drittanbieter-Indizes führen denselben Einstiegspunkt von 5 US-Dollar pro Mio. Input-Tokens und 25 US-Dollar pro Mio. Output-Tokens auf; wer Claude über eine andere Plattform oder einen Reseller nutzt, sollte trotzdem die dortige Endabrechnung prüfen.[7][19][21]

Preisüberblick: mehr als nur 5 und 25 US-Dollar

Im Folgenden steht MTok für 1.000.000 Tokens. Anthropic trennt in der Preislogik zwischen Base Input Tokens, Cache Writes, Cache Hits und Output Tokens. Genau so sollte auch die interne Kostenrechnung aufgebaut sein.[19]

KostenpostenPreisBedeutung
Base input tokens5 US-Dollar / MTokNormale Eingabe-Tokens, die nicht als Cache Write oder Cache Read abgerechnet werden.[19]
Output tokens25 US-Dollar / MTokTokens, die Claude in der Antwort generiert.[19]
Prompt cache write, 5-Minuten-TTL6,25 US-Dollar / MTokKosten für das erstmalige Schreiben wiederverwendbarer Prompt-Inhalte in den Cache bei 5 Minuten TTL.[19]
Prompt cache write, 1-Stunden-TTL10 US-Dollar / MTokKosten für Cache Writes mit 1 Stunde TTL.[19]
Cache read / hit0,50 US-Dollar / MTokKosten, wenn bereits gecachte Inhalte wieder gelesen werden.[19]

Die wichtigste Regel: Nicht einfach alle Tokens addieren und mit einem Durchschnittspreis multiplizieren. Sobald Prompt Caching im Spiel ist, haben verschiedene Tokenarten unterschiedliche Preise.[19]

Kostenformel ohne Prompt Caching

Ohne Cache ist die Rechnung überschaubar:

Kosten = input_tokens / 1_000_000 × 5 + output_tokens / 1_000_000 × 25

Beispiel: Ein Request mit 200.000 Input-Tokens und 20.000 Output-Tokens kostet nach den Anthropic-API-Listenpreisen 1,00 US-Dollar für Input plus 0,50 US-Dollar für Output, also 1,50 US-Dollar. Plattformaufschläge oder abweichende Anbieterabrechnungen sind darin nicht enthalten.[19]

Kostenformel mit Prompt Caching

Mit Prompt Caching sollte die Rechnung aufgeschlüsselt werden:

Kosten = base_input_tokens / 1_000_000 × 5 + output_tokens / 1_000_000 × 25 + cache_write_5m_tokens / 1_000_000 × 6.25 + cache_write_1h_tokens / 1_000_000 × 10 + cache_read_input_tokens / 1_000_000 × 0.50

Wenn nur eine Cache-TTL verwendet wird, bleibt nur die passende Cache-Write-Zeile in der Formel. Anthropic zeigt in den API-Usage-Beispielen Felder wie input_tokens, output_tokens, cache_creation_input_tokens und cache_read_input_tokens; die Pricing-Dokumentation trennt Cache Writes und Cache Hits ebenfalls als eigene Kostenposten.[15][19]

Tokens zählen: nicht nach Zeichen oder Wörtern schätzen

Für verlässliche Kostenschätzungen sollte nicht mit Zeichenanzahl, Wortzahl oder einer groben Faustregel gearbeitet werden. Anthropic stellt dafür den Endpoint /v1/messages/count_tokens bereit. Er kann vor dem eigentlichen Modellaufruf genutzt werden, akzeptiert eine ähnliche strukturierte Eingabe wie die Messages API und unterstützt unter anderem System Prompts, Tools, Bilder und PDFs. Die Antwort enthält die Gesamtzahl der Input-Tokens; laut Dokumentation unterstützen alle aktiven Modelle Token Counting.[18]

Praktisch heißt das: Den Payload, der später wirklich an die Messages API geht, möglichst unverändert an count_tokens senden. So lassen sich Budgets, Warnschwellen und Limits im Produkt deutlich belastbarer setzen.[18]

Nach dem Request: usage als Grundlage für die echte Abrechnung

Nach einem abgeschlossenen Request sollte die Anwendung die usage-Daten aus der API-Antwort speichern, statt die Länge des Antworttexts nachträglich zu schätzen. Die Messages-API-Beispiele zeigen input_tokens und output_tokens; die Streaming-Dokumentation zeigt zusätzlich Cache-bezogene Felder wie cache_creation_input_tokens und cache_read_input_tokens.[15][17]

Besonders wichtig bei Streaming: Die usage-Tokenwerte in message_delta sind kumulativ. Sie zeigen also den bis dahin aufsummierten Stand, nicht den Zuwachs dieses einzelnen Events. Wer jeden Delta-Wert einfach addiert, zählt Tokens doppelt oder mehrfach.[15]

Monatsabschluss und Team-Abrechnung

Für Live-Limits im Produkt reichen Request-Logs oft aus. Für Monatsabschluss, Workspace-Verteilung oder FinOps-Auswertungen ist die Usage & Cost Admin API der robustere Weg. Anthropic beschreibt sie als programmatischen, granularen Zugriff auf historische API-Nutzungs- und Kostendaten; Reports lassen sich unter anderem nach Modell, Workspace und Service Tier aufschlüsseln.[16]

Die sinnvolle Rollenverteilung ist daher: App-seitig usage pro Request speichern, um Nutzerlimits und Warnungen zu steuern. Für die offizielle Kostenanalyse und nachträgliche Abstimmung die historischen Usage- und Cost-Daten der Admin API heranziehen.[16]

Beim Upgrade auf Opus 4.7 Token-Budgets neu messen

Claude Opus 4.7 bringt einen neuen Tokenizer mit. Anthropic schreibt, dass dieser bei Text ungefähr 1x bis 1,35x so viele Tokens wie frühere Modelle verwenden kann, also je nach Inhalt bis zu rund 35 Prozent mehr. Außerdem kann /v1/messages/count_tokens für denselben Inhalt bei Opus 4.7 andere Tokenzahlen liefern als bei Opus 4.6.[20]

Der Listenpreis von 5 US-Dollar pro MTok Input und 25 US-Dollar pro MTok Output bedeutet deshalb nicht automatisch, dass die Rechnung beim Wechsel von Opus 4.6 oder älteren Modellen gleich bleibt. Vor einer Migration sollten besonders häufige Prompts, lange Kontexte, Payloads mit Tool-Definitionen und teure Workflows erneut über /v1/messages/count_tokens geprüft werden.[18][20]

Checkliste für die Kostenkontrolle

  • Modell-ID in der API auf claude-opus-4-7 prüfen.[9]
  • Vor größeren Releases repräsentative Payloads mit /v1/messages/count_tokens messen.[18]
  • input_tokens, output_tokens, Cache Writes und Cache Reads getrennt speichern, nicht nur eine Gesamtsumme.[15][19]
  • Bei Streaming beachten: message_delta.usage ist kumulativ und darf nicht eventweise aufsummiert werden.[15]
  • Für Monatsberichte, Workspace-Splits und historische Analysen die Usage & Cost Admin API verwenden.[16]
  • Beim Wechsel von älteren Claude-Modellen zu Opus 4.7 die Auswirkungen des neuen Tokenizers neu testen.[20]

Kurz gesagt: Die Basispreise von Claude Opus 4.7 sind leicht zu merken. Richtig belastbar wird die Kalkulation aber erst, wenn vor dem Request gezählt, nach dem Request usage protokolliert und Prompt Caching sowie der neue Tokenizer separat modelliert werden.[18][19][20]

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

使用 Studio Global AI 搜尋並查核事實

重點

  • In der Anthropic API liegt der Basispreis für Claude Opus 4.7 bei 5 US Dollar pro Mio.
  • Kosten sollten nicht als Gesamt Tokens mal Einheitswert kalkuliert werden: Input, Output, Cache Writes und Cache Reads brauchen eigene Zeilen.[15][19]
  • Vor dem Request hilft /v1/messages/count tokens, nach dem Request die usage Angaben und für Monatsabgleiche die Usage & Cost Admin API; der neue Tokenizer kann zudem etwa 1x bis 1,35x so viele Tokens wie frühere Model...

人們還問

「Claude Opus 4.7 API-Kosten richtig kalkulieren」的簡短答案是什麼?

In der Anthropic API liegt der Basispreis für Claude Opus 4.7 bei 5 US Dollar pro Mio.

首先要驗證的關鍵點是什麼?

In der Anthropic API liegt der Basispreis für Claude Opus 4.7 bei 5 US Dollar pro Mio. Kosten sollten nicht als Gesamt Tokens mal Einheitswert kalkuliert werden: Input, Output, Cache Writes und Cache Reads brauchen eigene Zeilen.[15][19]

接下來在實務上我該做什麼?

Vor dem Request hilft /v1/messages/count tokens, nach dem Request die usage Angaben und für Monatsabgleiche die Usage & Cost Admin API; der neue Tokenizer kann zudem etwa 1x bis 1,35x so viele Tokens wie frühere Model...

接下來我應該探索哪個相關主題?

繼續“Claude Security 公測版:Anthropic 點樣用 AI 幫企業掃 code 漏洞”以獲得另一個角度和額外的引用。

開啟相關頁面

我應該將其與什麼進行比較?

對照「xAI Grok 4.3 API 解讀:1M context、低 token 價與語音平台野心」交叉檢查此答案。

開啟相關頁面

繼續你的研究

研究對話

研究問題

搜尋及事實查核:Claude Opus 4.7 幾錢?token 點計先最清楚?

Studio Global AI29 來源

引用的答案

如果你講嘅係 Anthropic API,Claude Opus 4.7 官方價目前係每百萬 input tokens 收 $5、每百萬 output tokens 收 $25;如果用 prompt caching,5 分鐘 cache write 係 $6.25/MTok、1 小時 cache write 係 $10/MTok、cache hit/refresh 係 $0.50/MTok。[3] 而且 Opus 4.7 用咗新 tokenizer,官方話同一段固定文字相比舊模型可能會多用最多約 35% tokens,所以「標價冇變」唔代表實際成本一定同舊版一樣。[3][8]

  • 官方 models 頁面列明 Claude Opus 4.7 已經係 generally available,API model ID 係 claude-opus-4-7,定價同上面一致。[2]

  • 最清楚嘅 token 計法,唔好自己估字數,直接用官方 /v1/messages/count_tokens;Anthropic 話呢個 token counting endpoint 接受同 Messages API 一樣嘅結構化輸入,可以喺送出前先計好 input tokens。[9]

  • 送出 request 之後,再睇 API 回傳嘅 usage 欄位;官方文件示例顯示會有 input_tokensoutput_tokens,以及快取相關欄位如 cache_creation_input_tokenscache_read_input_tokens[5]

  • 如果你用 streaming,message_delta 入面見到嘅 usage token counts 係累積值,不是每個 event 單獨新增值。[5]

  • 如果你想對帳最準,官方建議用 Usage & Cost Admin API,因為佢提供歷史 usage 同 cost 資料,並強調可以攞到較精確嘅 token counts,而唔係只靠單次 response 去估。[6]

  • 實際計錢公式,最易記係:

    • 無 cache:
      成本 = (input_tokens / 1,000,000 × $5) + (output_tokens / 1,000,000 × $25)
      [3]
    • 有 cache:再加上 cache_creation_input_tokens 對應 write 價,並把 cache_read_input_tokens 按 $0.50/MTok 去計。[3][5]
  • 例子:如果一次 request 用咗 200,000 input tokens 同 20,000 output tokens,未計 cache 時大約係 $1.00 + $0.50 = $1.50。[3]

  • 要留意,Opus 4.7 新 tokenizer 可能令同一段 prompt 比舊 model 食多 token,所以你如果由 Opus 4.6 轉過去,最好先跑一次 count_tokens 再改 budget。[8][9]

如果你想,我可以下一步直接幫你整一個「Claude Opus 4.7 成本速算表」:輸入 prompt token、output token、cache 有冇開,我即刻幫你計到每次 request 幾錢。

來源

  • [7] Claude Opus 4.7 pricing & specs — Anthropic | CloudPricecloudprice.net

    Claude Opus 4.7. Claude Opus 4.7isAnthropic logoAnthropic's language model with a 1.0M context window and up to 128K output tokens, available from 7 providers, starting at $5.00 / 1M input and $25.00 / 1M output. Canonical ID anthropic-claude-4-7-opus . Ama...

  • [9] Introducing Claude Opus 4.7 - Anthropicanthropic.com

    Skip to main contentSkip to footer. Developers can use claude-opus-4-7 via the Claude API. . . ![Image 5: logo](

  • [15] Streaming Messages - Claude API Docsplatform.claude.com

    event: message startevent: message startdata: {"type":"message start","message":{"id":"msg 01G...","type":"message","role":"assistant","model":"claude-opus-4-6","content":[],"stop reason":null,"stop sequence":null,"usage":{"input tokens":2679,"cache creatio...

  • [16] Usage and Cost API - Claude API Docsplatform.claude.com

    Usage and Cost API. The Usage & Cost Admin API provides programmatic and granular access to historical API usage and cost data for your organization. Leading observability platforms offer ready-to-use integrations for monitoring your Claude API usage and co...

  • [17] Using the Messages API - Claude API Docsplatform.claude.com

    !/bin/sh !/bin/shcurl \ curl \ --header "x-api-key: $ANTHROPIC API KEY" \ --header "x-api-key: $ANTHROPIC API KEY " \ --header "anthropic-version: 2023-06-01" \ --header "anthropic-version: 2023-06-01" \ --header "content-type: application/json" \ --header...

  • [18] Token counting - Claude API Docsplatform.claude.com

    Token counting. Token counting enables you to determine the number of tokens in a message before sending it to Claude, helping you make informed decisions about your prompts and usage. With token counting, you can. How to count message tokens. The token cou...

  • [19] Pricing - Claude API Docsplatform.claude.com

    The "Base Input Tokens" column shows standard input pricing, "Cache Writes" and "Cache Hits" are specific to prompt caching, and "Output Tokens" shows output pricing. Prompt caching multipliers apply on top of fast mode pricing. Fast mode is not available w...

  • [20] What's new in Claude Opus 4.7platform.claude.com

    Claude Opus 4.7 introduces task budgets. This new tokenizer may use roughly 1x to 1.35x as many tokens when processing text compared to previous models (up to 35% more, varying by content), and /v1/messages/count tokens will return a different number of tok...

  • [21] Claude Opus 4.7 API Pricing 2026 - Costs, Performance & Providerspricepertoken.com

    Join the conversation on AI models, pricing, and tools. Price Per TokenPrice Per Token. Claude Opus 4.7 API Pricing 2026. Compare pricing, benchmarks, and providers for Claude Opus 4.7. Pricing starts at $5.00 per million input tokens and $25.00 per million...