studioglobal
熱門發現
答案已發布9 來源

Claude Opus 4.7 API: cuánto cuesta y cómo contar tokens sin equivocarte

En Anthropic API, Claude Opus 4.7 parte de USD 5 por millón de tokens de entrada y USD 25 por millón de tokens de salida; con prompt caching hay tarifas separadas para escritura y lectura de caché.[19] Para estimar antes de llamar al modelo, Anthropic ofrece /v1/messages/count tokens, que acepta un payload estructur...

18K0
Claude Opus 4.7 API 收費表、token 計算與 prompt caching 成本公式的編輯插圖
Claude Opus 4.7 API 收費指南:$5/$25、Token 計法同成本公式AI-generated editorial illustration for Claude Opus 4.7 API pricing and token accounting.
AI 提示

Create a landscape editorial hero image for this Studio Global article: Claude Opus 4.7 API 收費指南:$5/$25、Token 計法同成本公式. Article summary: Claude Opus 4.7 API 基礎價係每百萬 input tokens $5、每百萬 output tokens $25;但 prompt caching 要另計,而且新 tokenizer 可能令同一段文字用大約 1x 至 1.35x token。[19][20]. Topic tags: ai, anthropic, claude, api pricing, llm. Reference image context from search candidates: Reference image 1: visual subject "# Claude Opus 4.7 上线完全指南(2026 最新):核心升级与国内 API 接入方案. **Claude Opus 4.7 于 2026 年 4 月 16 日正式发布,API model ID 为 `claude-opus-4-7`,定价维持与 Opus 4.6 相同的 $5/M 输入 token、$25/M 输出 token 不变,1M t" source context "Claude Opus 4.7 上线完全指南(2026 最新):核心升级与 ..." Reference image 2: visual subject "# Claude Opus 4.7 上线完全指南(2026 最新):核心升级与国内 API 接入方案. **Claude Opus 4.7 于 2026 年 4 月 16 日正式发布,API model ID 为 `claude-opus-4-7`,定价维持与 Opus 4.6 相同的 $5/M 输入 token、$25/M 输出 token 不变,1M t" source context "Claude Opus 4.

openai.com

Claude Opus 4.7 tiene una tarifa base fácil de recordar, pero calcular el gasto real de una app exige separar varias partidas. Anthropic señala que el modelo se usa en la Claude API con el ID claude-opus-4-7; los índices de precios de terceros también muestran como punto de partida USD 5 por millón de tokens de entrada y USD 25 por millón de tokens de salida. Si accedes por otra plataforma o proveedor, comprueba siempre su factura final.[7][9][19][21]

Precio base: no metas todos los tokens en el mismo saco

En esta guía, MTok significa 1.000.000 de tokens. La página de precios de Anthropic separa tokens de entrada base, escrituras de caché, aciertos de caché y tokens de salida; por eso el cálculo conviene hacerlo por columnas, no con un único total.[19]

PartidaPrecioCómo leerlo
Tokens de entrada baseUSD 5 / MTokEntrada estándar enviada al modelo, cuando no se contabiliza como escritura o lectura de caché.[19]
Tokens de salidaUSD 25 / MTokTokens generados por Claude en la respuesta.[19]
Escritura en prompt cache, TTL de 5 minutosUSD 6,25 / MTokPrimera escritura de contenido reutilizable en la caché con vida de 5 minutos.[19]
Escritura en prompt cache, TTL de 1 horaUSD 10 / MTokEscritura de contenido reutilizable con vida de 1 hora.[19]
Lectura o acierto de cachéUSD 0,50 / MTokLectura de contenido que ya estaba en caché.[19]

La consecuencia práctica: no basta con multiplicar total tokens por un precio medio. En Opus 4.7, entrada, salida, escritura de caché y lectura de caché tienen precios distintos; si tu producto usa prompt caching, tu modelo de costes debe separarlos.[19]

Fórmula si no usas prompt caching

Para una llamada simple, sin caché, el cálculo es:

text
coste = input_tokens / 1_000_000 * 5 + output_tokens / 1_000_000 * 25

Ejemplo: una petición con 200.000 tokens de entrada y 20.000 tokens de salida costaría USD 1,00 + USD 0,50 = USD 1,50. Es solo la aritmética de la tarifa de Anthropic; no incluye posibles condiciones de otra plataforma si no llamas directamente a la API de Anthropic.[19]

Fórmula si usas prompt caching

Con caché de prompts, suma cada tipo de token por separado:

text
coste = base_input_tokens / 1_000_000 * 5
      + output_tokens / 1_000_000 * 25
      + cache_write_5m_tokens / 1_000_000 * 6.25
      + cache_write_1h_tokens / 1_000_000 * 10
      + cache_read_input_tokens / 1_000_000 * 0.50

Si solo utilizas un TTL de caché, conserva únicamente la línea de escritura que corresponda. La documentación de streaming de Anthropic muestra que usage puede incluir campos como input_tokens, output_tokens, cache_creation_input_tokens y cache_read_input_tokens; la página de precios, por su parte, cobra de forma separada las escrituras y los aciertos de caché.[15][19]

Antes de llamar al modelo: usa count_tokens

No estimes el coste por número de palabras, caracteres o páginas. Anthropic ofrece el endpoint /v1/messages/count_tokens para contar tokens antes de enviar un mensaje; acepta una estructura similar a la de Messages API, con soporte para system prompts, herramientas, imágenes y PDFs, y devuelve el total de tokens de entrada. Anthropic indica además que todos los modelos activos admiten el conteo de tokens.[18]

El flujo más fiable es construir exactamente el payload que mandarías a Messages API —incluidos system prompt, mensajes, herramientas, imágenes o PDF— y pasarlo primero por count_tokens. Así puedes estimar el gasto de entrada antes de ejecutar la llamada y fijar límites, alertas o presupuestos dentro de tu producto.[18]

Después de la respuesta: registra usage, no el texto final

La estimación previa sirve para decidir si lanzar la petición; la contabilidad real debe salir del campo usage de la respuesta. Los ejemplos de Messages API muestran input_tokens y output_tokens, y la documentación de streaming añade campos relacionados con la caché, como cache_creation_input_tokens y cache_read_input_tokens.[15][17]

Si usas streaming, hay un detalle que evita muchos descuadres: los recuentos de usage dentro de message_delta son acumulados, no incrementos de cada evento. Si sumas todos los deltas como si fueran nuevos tokens, contarás de más.[15]

Para cierres mensuales: Usage & Cost Admin API

Guardar usage por petición es útil para límites en tiempo real, paneles internos o avisos al usuario. Para cierres mensuales, reparto por workspace o análisis histórico, Anthropic documenta la Usage & Cost Admin API, que ofrece acceso programático y granular a datos históricos de uso y coste, con desgloses por modelo, workspace y service tier.[16]

En otras palabras: usa los logs de cada request para controlar la aplicación; para conciliación financiera o reporting de equipo, apóyate en la API administrativa de uso y coste.[16]

Si vienes de Opus 4.6, rehaz el presupuesto de tokens

Opus 4.7 introduce un nuevo tokenizer. Anthropic advierte que, al procesar texto, puede usar aproximadamente entre 1x y 1,35x tokens respecto a modelos anteriores —hasta alrededor de un 35% más, según el contenido—, y que /v1/messages/count_tokens puede devolver un número distinto en Opus 4.7 que en Opus 4.6.[20]

Por eso, mantener la misma tarifa visible de USD 5/MTok de entrada y USD 25/MTok de salida no garantiza que tu factura sea idéntica tras migrar. Antes de pasar tráfico importante a Opus 4.7, vuelve a medir prompts de alto volumen, contextos largos, payloads con definiciones de herramientas y los flujos más caros con /v1/messages/count_tokens.[18][19][20]

Lista rápida de comprobación

  • Usa el ID de modelo claude-opus-4-7 cuando llames a Claude API.[9]
  • Antes de una release importante, ejecuta /v1/messages/count_tokens sobre payloads representativos.[18]
  • Guarda por separado tokens de entrada, tokens de salida, escrituras de caché y lecturas de caché; no almacenes solo un total genérico.[15][19]
  • En streaming, recuerda que message_delta.usage es acumulado y no debe sumarse evento por evento como si fueran incrementos.[15]
  • Para cierres por equipo, workspace o tendencia histórica, usa Usage & Cost Admin API.[16]
  • Si migras desde Claude Opus 4.6 u otro modelo anterior, vuelve a medir el efecto del nuevo tokenizer sobre tus prompts reales.[20]
  • Si llamas a Opus 4.7 a través de un proveedor distinto de Anthropic, valida la tarifa efectiva en esa plataforma.[7][21]

En resumen: el precio base de Claude Opus 4.7 API es fácil de recordar —USD 5/MTok de entrada y USD 25/MTok de salida—, pero el coste correcto se calcula con count_tokens antes de enviar, usage después de responder, y una contabilidad separada para caché y tokenizer.[18][19][20]

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

使用 Studio Global AI 搜尋並查核事實

重點

  • En Anthropic API, Claude Opus 4.7 parte de USD 5 por millón de tokens de entrada y USD 25 por millón de tokens de salida; con prompt caching hay tarifas separadas para escritura y lectura de caché.[19]
  • Para estimar antes de llamar al modelo, Anthropic ofrece /v1/messages/count tokens, que acepta un payload estructurado similar al de Messages API.[18]
  • Si migras desde Opus 4.6, vuelve a medir: el nuevo tokenizer de Opus 4.7 puede usar aproximadamente entre 1x y 1,35x tokens frente a modelos anteriores, según el contenido.[20]

人們還問

「Claude Opus 4.7 API: cuánto cuesta y cómo contar tokens sin equivocarte」的簡短答案是什麼?

En Anthropic API, Claude Opus 4.7 parte de USD 5 por millón de tokens de entrada y USD 25 por millón de tokens de salida; con prompt caching hay tarifas separadas para escritura y lectura de caché.[19]

首先要驗證的關鍵點是什麼?

En Anthropic API, Claude Opus 4.7 parte de USD 5 por millón de tokens de entrada y USD 25 por millón de tokens de salida; con prompt caching hay tarifas separadas para escritura y lectura de caché.[19] Para estimar antes de llamar al modelo, Anthropic ofrece /v1/messages/count tokens, que acepta un payload estructurado similar al de Messages API.[18]

接下來在實務上我該做什麼?

Si migras desde Opus 4.6, vuelve a medir: el nuevo tokenizer de Opus 4.7 puede usar aproximadamente entre 1x y 1,35x tokens frente a modelos anteriores, según el contenido.[20]

接下來我應該探索哪個相關主題?

繼續“Claude Security 公測版:Anthropic 點樣用 AI 幫企業掃 code 漏洞”以獲得另一個角度和額外的引用。

開啟相關頁面

我應該將其與什麼進行比較?

對照「xAI Grok 4.3 API 解讀:1M context、低 token 價與語音平台野心」交叉檢查此答案。

開啟相關頁面

繼續你的研究

研究對話

研究問題

搜尋及事實查核:Claude Opus 4.7 幾錢?token 點計先最清楚?

Studio Global AI29 來源

引用的答案

如果你講嘅係 Anthropic API,Claude Opus 4.7 官方價目前係每百萬 input tokens 收 $5、每百萬 output tokens 收 $25;如果用 prompt caching,5 分鐘 cache write 係 $6.25/MTok、1 小時 cache write 係 $10/MTok、cache hit/refresh 係 $0.50/MTok。[3] 而且 Opus 4.7 用咗新 tokenizer,官方話同一段固定文字相比舊模型可能會多用最多約 35% tokens,所以「標價冇變」唔代表實際成本一定同舊版一樣。[3][8]

  • 官方 models 頁面列明 Claude Opus 4.7 已經係 generally available,API model ID 係 claude-opus-4-7,定價同上面一致。[2]

  • 最清楚嘅 token 計法,唔好自己估字數,直接用官方 /v1/messages/count_tokens;Anthropic 話呢個 token counting endpoint 接受同 Messages API 一樣嘅結構化輸入,可以喺送出前先計好 input tokens。[9]

  • 送出 request 之後,再睇 API 回傳嘅 usage 欄位;官方文件示例顯示會有 input_tokensoutput_tokens,以及快取相關欄位如 cache_creation_input_tokenscache_read_input_tokens[5]

  • 如果你用 streaming,message_delta 入面見到嘅 usage token counts 係累積值,不是每個 event 單獨新增值。[5]

  • 如果你想對帳最準,官方建議用 Usage & Cost Admin API,因為佢提供歷史 usage 同 cost 資料,並強調可以攞到較精確嘅 token counts,而唔係只靠單次 response 去估。[6]

  • 實際計錢公式,最易記係:

    • 無 cache:
      成本 = (input_tokens / 1,000,000 × $5) + (output_tokens / 1,000,000 × $25)
      [3]
    • 有 cache:再加上 cache_creation_input_tokens 對應 write 價,並把 cache_read_input_tokens 按 $0.50/MTok 去計。[3][5]
  • 例子:如果一次 request 用咗 200,000 input tokens 同 20,000 output tokens,未計 cache 時大約係 $1.00 + $0.50 = $1.50。[3]

  • 要留意,Opus 4.7 新 tokenizer 可能令同一段 prompt 比舊 model 食多 token,所以你如果由 Opus 4.6 轉過去,最好先跑一次 count_tokens 再改 budget。[8][9]

如果你想,我可以下一步直接幫你整一個「Claude Opus 4.7 成本速算表」:輸入 prompt token、output token、cache 有冇開,我即刻幫你計到每次 request 幾錢。

來源

  • [7] Claude Opus 4.7 pricing & specs — Anthropic | CloudPricecloudprice.net

    Claude Opus 4.7. Claude Opus 4.7isAnthropic logoAnthropic's language model with a 1.0M context window and up to 128K output tokens, available from 7 providers, starting at $5.00 / 1M input and $25.00 / 1M output. Canonical ID anthropic-claude-4-7-opus . Ama...

  • [9] Introducing Claude Opus 4.7 - Anthropicanthropic.com

    Skip to main contentSkip to footer. Developers can use claude-opus-4-7 via the Claude API. . . ![Image 5: logo](

  • [15] Streaming Messages - Claude API Docsplatform.claude.com

    event: message startevent: message startdata: {"type":"message start","message":{"id":"msg 01G...","type":"message","role":"assistant","model":"claude-opus-4-6","content":[],"stop reason":null,"stop sequence":null,"usage":{"input tokens":2679,"cache creatio...

  • [16] Usage and Cost API - Claude API Docsplatform.claude.com

    Usage and Cost API. The Usage & Cost Admin API provides programmatic and granular access to historical API usage and cost data for your organization. Leading observability platforms offer ready-to-use integrations for monitoring your Claude API usage and co...

  • [17] Using the Messages API - Claude API Docsplatform.claude.com

    !/bin/sh !/bin/shcurl \ curl \ --header "x-api-key: $ANTHROPIC API KEY" \ --header "x-api-key: $ANTHROPIC API KEY " \ --header "anthropic-version: 2023-06-01" \ --header "anthropic-version: 2023-06-01" \ --header "content-type: application/json" \ --header...

  • [18] Token counting - Claude API Docsplatform.claude.com

    Token counting. Token counting enables you to determine the number of tokens in a message before sending it to Claude, helping you make informed decisions about your prompts and usage. With token counting, you can. How to count message tokens. The token cou...

  • [19] Pricing - Claude API Docsplatform.claude.com

    The "Base Input Tokens" column shows standard input pricing, "Cache Writes" and "Cache Hits" are specific to prompt caching, and "Output Tokens" shows output pricing. Prompt caching multipliers apply on top of fast mode pricing. Fast mode is not available w...

  • [20] What's new in Claude Opus 4.7platform.claude.com

    Claude Opus 4.7 introduces task budgets. This new tokenizer may use roughly 1x to 1.35x as many tokens when processing text compared to previous models (up to 35% more, varying by content), and /v1/messages/count tokens will return a different number of tok...

  • [21] Claude Opus 4.7 API Pricing 2026 - Costs, Performance & Providerspricepertoken.com

    Join the conversation on AI models, pricing, and tools. Price Per TokenPrice Per Token. Claude Opus 4.7 API Pricing 2026. Compare pricing, benchmarks, and providers for Claude Opus 4.7. Pricing starts at $5.00 per million input tokens and $25.00 per million...