studioglobal
熱門探索內容
答案已發布3 個來源

Claude Opus 4.7 API: cómo estimar el coste en documentos largos, conversaciones y batch jobs

Claude Opus 4.7 cuesta, en la Claude API pública, 5 USD por millón de tokens de entrada y 25 USD por millón de tokens de salida; para documentos de un solo uso basta con aplicar esa fórmula base.[2] En documentos largos o conversaciones repetidas, el prompt caching cambia mucho el presupuesto: en un ejemplo con un d...

16K0
Claude Opus 4.7 API 價格試算與長上下文成本分析示意圖
Claude Opus 4.7 API 價格試算:長文件、長對話與批次任務預算指南長文件與長對話的 API 預算,應拆成 input、output、prompt caching 與安全 buffer 分別估算。
AI 提示詞

Create a landscape editorial hero image for this Studio Global article: Claude Opus 4.7 API 價格試算:長文件、長對話與批次任務預算指南. Article summary: Claude Opus 4.7 API 的基礎價是每百萬 input tokens $5、output tokens $25;一次性任務可直接套公式,但長文件與長對話若會反覆查問,成本關鍵通常是 prompt caching 與 token buffer。[2]. Topic tags: ai, anthropic, claude, api pricing, prompt caching. Reference image context from search candidates: Reference image 1: visual subject "# Claude Opus 4.7 上线完全指南(2026 最新):核心升级与国内 API 接入方案. **Claude Opus 4.7 于 2026 年 4 月 16 日正式发布,API model ID 为 `claude-opus-4-7`,定价维持与 Opus 4.6 相同的 $5/M 输入 token、$25/M 输出 token 不变,1M t" source context "Claude Opus 4.7 上线完全指南(2026 最新):核心升级与 ..." Reference image 2: visual subject "Claude API 定价 2026:Anthropic 最新 Opus、Sonnet、Haiku 成本. | **Claude Opus 4.7** | $5.00 | $25.00 | 最新旗舰,适合复杂编码、智能体和高自治任务 |. | **Claude Opus 4.6** | $5.00 | $25.00 | 上一代旗舰,适合迁移对照和已固定版本部" source context "Claude API 定价2

openai.com

Calcular el coste de Claude Opus 4.7 no consiste solo en mirar cuántos tokens tiene una petición aislada. La factura se dispara cuando una aplicación reenvía el mismo documento largo, o todo el historial de una conversación, en cada turno. Si ese contexto se reutiliza, el prompt caching puede ser la frontera entre un coste asumible y uno incómodo.

Anthropic indica que los desarrolladores pueden usar claude-opus-4-7 mediante la Claude API.[11] Los ejemplos de esta guía usan únicamente los precios públicos de la Claude API; no incluyen contratos empresariales, endpoints de plataformas cloud, routers de terceros, impuestos ni variaciones por tipo de cambio.

Primero: entender el precio por MTok

La documentación de precios de Claude API publica las tarifas de Claude Opus 4.7 por millón de tokens, o MTok: entrada base, salida y prompt caching.[2]

Concepto de facturaciónPrecio público de Claude Opus 4.7
Tokens de entrada base5 USD / 1M tokens
Tokens de salida25 USD / 1M tokens
Escritura de caché de 5 minutos6,25 USD / 1M tokens
Escritura de caché de 1 hora10 USD / 1M tokens
Cache hit / refresh0,50 USD / 1M tokens

Sin caché, la fórmula básica es:[2]

text
Coste = input_tokens / 1.000.000 × 5
      + output_tokens / 1.000.000 × 25

Con prompt caching, conviene separar el contexto reutilizable del resto: la primera escritura en caché de 5 minutos se cobra a 6,25 USD/MTok; la de 1 hora, a 10 USD/MTok; los usos posteriores con cache hit o refresh se cobran a 0,50 USD/MTok. Las preguntas nuevas o mensajes no cacheados siguen pagando el precio normal de entrada, y la respuesta del modelo sigue pagando el precio de salida.[2]

Documento largo de un solo uso: input + output

Si vas a analizar un documento una sola vez y no habrá preguntas posteriores, el cálculo es directo: documento, instrucciones del sistema y pregunta cuentan como tokens de entrada; la respuesta del modelo cuenta como tokens de salida. Con el precio público de la Claude API, quedarían ejemplos así:[2]

CasoEntradaSalidaCoste estimado
Resumen de documento largo, pero moderado100k5kaprox. 0,625 USD
Análisis de documento mediano-grande300k8kaprox. 1,70 USD
Análisis de documento muy grande1M10kaprox. 5,25 USD

Ejemplo con 300k tokens de entrada y 8k de salida:

text
300.000 / 1.000.000 × 5  = 1,50
8.000 / 1.000.000 × 25   = 0,20
Total                     = 1,70 USD

Si migras desde un modelo anterior, no conviene reutilizar sin más las estimaciones antiguas de tokens. Anthropic señala que Opus 4.7 usa un nuevo tokenizer, y que el número de tokens para un texto fijo puede aumentar hasta un 35%.[2]

Por ejemplo, una estimación original de 300k tokens de entrada puede presupuestarse de forma conservadora como 405k. Con 8k tokens de salida:

text
405.000 / 1.000.000 × 5  = 2,025
8.000 / 1.000.000 × 25   = 0,20
Total                     ≈ 2,23 USD

El mismo documento con varias preguntas: ahí manda la caché

En productos basados en documentos largos, el coste que más se subestima no suele ser la respuesta del modelo, sino reenviar el mismo texto enorme en cada turno. Si un documento se consultará varias veces, el prompt caching debería entrar en el modelo de presupuesto desde el principio.[2]

Supongamos:

  • Documento: 300k tokens
  • Nueva pregunta por turno: 2k tokens
  • Respuesta por turno: 2k tokens de salida
  • Caché de prompt de 5 minutos
EstrategiaComposición del costeCoste estimado
Primera consulta: crear caché de 5 minutos300k × 6,25 USD/MTok + 2k × 5 USD/MTok + 2k × 25 USD/MTokaprox. 1,935 USD
Consulta posterior con cache hit300k × 0,50 USD/MTok + 2k × 5 USD/MTok + 2k × 25 USD/MTokaprox. 0,21 USD
Sin caché: reenviar todo cada vez302k × 5 USD/MTok + 2k × 25 USD/MTokaprox. 1,56 USD

En este ejemplo, la primera ronda con caché es más cara que una petición sin caché. Pero a partir de la segunda consulta sobre el mismo documento, el coste total ya baja:

text
Sin caché, dos turnos: aprox. 1,56 × 2 = 3,12 USD
Con caché de 5 minutos, dos turnos: aprox. 1,935 + 0,21 = 2,145 USD

Por eso, en preguntas y respuestas sobre documentos largos, la métrica clave es la tasa de cache hit: si el documento se consulta realmente varias veces, si las preguntas llegan dentro de la ventana de caché y si cada turno añade mucho contenido nuevo no cacheado.[2]

Conversaciones largas: no recalcules todo el historial en cada turno

La lógica para chats largos es parecida. Si la aplicación reenvía una gran cantidad de historial en cada mensaje, el coste de entrada crece muy rápido. El contexto estable y reutilizable debería evaluarse como candidato a prompt caching.[2]

Supongamos:

  • Historial de conversación: 200k tokens
  • Nuevo mensaje por turno: 1k tokens
  • Salida por turno: 2k tokens
EstrategiaCoste estimado
Sin caché: 200k de historial + 1k mensaje nuevo + 2k de salida en cada turnoaprox. 1,055 USD / turno
Escribir 200k de historial en caché de 5 minutos: primer turnoaprox. 1,305 USD
Después, con cache hit de 5 minutosaprox. 0,155 USD / turno
Escribir 200k de historial en caché de 1 hora: primer turnoaprox. 2,055 USD
Después, con cache hit de 1 horaaprox. 0,155 USD / turno

La elección entre caché de 5 minutos y de 1 hora no debería depender solo del precio de escritura. Depende del comportamiento real del usuario:

  • Si suele hacer varias preguntas seguidas en menos de 5 minutos, empieza modelando la caché de 5 minutos.
  • Si vuelve con frecuencia después de más de 5 minutos, pero normalmente dentro de una hora, la caché de 1 hora cuesta más al principio, pero puede evitar reconstrucciones repetidas.
  • Si los intervalos son impredecibles, conviene medir tráfico real, calcular la tasa de cache hit y ajustar la arquitectura.

Tareas por lote: presupuesta primero con el precio síncrono

Las tareas batch suelen aparecer en análisis offline, etiquetado de datos, resúmenes masivos o clasificación a gran escala. Pero si todavía no has confirmado qué precio por lote se aplica a tu cuenta, contrato o endpoint, no es prudente incluir descuentos no verificados en un presupuesto formal. Una forma conservadora es estimar primero con el precio público síncrono y después sustituirlo por la tarifa real cuando la tengas confirmada.[2]

La fórmula conservadora sería:

text
Coste total = tokens de entrada totales / 1.000.000 × 5
            + tokens de salida totales / 1.000.000 × 25

Ejemplo: 10.000 tareas, cada una con 2k tokens de entrada y 500 tokens de salida.

text
Entrada total = 10.000 × 2.000 = 20.000.000 tokens
Salida total  = 10.000 × 500   = 5.000.000 tokens

Coste de entrada = 20 × 5  = 100 USD
Coste de salida  = 5 × 25  = 125 USD
Total             = 225 USD

Ese total de 225 USD es una estimación conservadora sin aplicar ningún descuento batch. Si después confirmas una tarifa por lote, basta con reemplazar los precios unitarios.

También importa por dónde accedes al modelo. Si no llamas directamente a la Claude API de Anthropic y usas una plataforma cloud o un router de terceros, la factura puede cambiar. CloudPrice, una fuente de terceros, lista Opus 4.7 en Anthropic / global a 5 USD de entrada y 25 USD de salida por MTok, y también muestra algunos códigos regionales de AWS Bedrock a 5,50 USD de entrada y 27,50 USD de salida por MTok. Ese tipo de referencia sirve como alerta de comprobación; para compras reales, manda la página de facturación de tu plataforma, tu contrato y la documentación oficial aplicable.[12]

Añade margen: el cálculo teórico rara vez basta

Si aún no tienes una distribución real de tokens, un presupuesto puramente teórico suele quedarse corto. Como mínimo, incluye tres colchones:

  1. Riesgo de tokenizer: el nuevo tokenizer de Opus 4.7 puede aumentar hasta un 35% los tokens de un texto fijo.[2]
  2. Incertidumbre de la caché: la caché solo reduce costes de forma notable si el contexto se reutiliza y sigue dentro de la ventana válida.[2]
  3. Uso real del producto: los usuarios pueden pedir respuestas más largas, reintentar, subir documentos mayores o mantener conversaciones más extensas de lo previsto.

Como guía no oficial de presupuesto:

FaseMultiplicador prudente
PoC o prueba inicialvalor teórico × 1,2 a 1,5
Producción con tráfico establevalor teórico × 1,35 a 1,6
Migración desde un modelo anterior a Opus 4.7 con mucho contexto largovalor teórico × 1,5 a 1,8

Estos multiplicadores no son una tarifa oficial de Anthropic. Son una forma conservadora de gestionar presupuesto. Una vez en producción, lo ideal es recalibrar con logs reales de tokens, tasa de cache hit y facturas.

Plantilla rápida de cálculo mensual

Sin caché:

text
Coste mensual ≈ solicitudes diarias × 30
              × (input medio / 1.000.000 × 5
                 + output medio / 1.000.000 × 25)

Con caché, separa los componentes:

text
Coste mensual ≈ coste de entrada normal
              + coste de escrituras de caché
              + coste de cache hit / refresh
              + coste de salida

Antes de implementar, al menos rellena estas variables:

VariableEjemplo
Tokens medios de entrada por petición300.000
Tokens medios de salida por petición8.000
Solicitudes diarias1.000
Tokens de cache write300.000 por documento
Tokens de cache hit300.000 por acierto
Tasa de cache hit60%
Margen por cambio de tokenizerhasta × 1,35
Margen operativopor ejemplo × 1,35 a 1,6

Regla práctica final

Para un análisis único de documento largo, usa directamente 5 USD/MTok de entrada y 25 USD/MTok de salida.[2]

Para el mismo documento con varias preguntas, o para conversaciones largas que arrastran mucho historial, calcula el prompt caching desde el diseño. En el ejemplo de documento de 300k tokens, pregunta de 2k y salida de 2k, una segunda ronda con caché de 5 minutos cuesta unos 0,21 USD; reenviar todo cada vez cuesta unos 1,56 USD.[2]

Para batch jobs, empieza con el precio público síncrono si aún no tienes confirmado el descuento, endpoint o contrato aplicable. Y si migras desde un modelo anterior a Opus 4.7, presupuestar la entrada con un margen de hasta ×1,35 por tokenizer, más un colchón operativo, suele estar más cerca de la factura real que mirar solo el precio de lista.[2]

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

使用 Studio Global AI 搜尋並查證事實

重點整理

  • Claude Opus 4.7 cuesta, en la Claude API pública, 5 USD por millón de tokens de entrada y 25 USD por millón de tokens de salida; para documentos de un solo uso basta con aplicar esa fórmula base.[2]
  • En documentos largos o conversaciones repetidas, el prompt caching cambia mucho el presupuesto: en un ejemplo con un documento de 300k tokens, una segunda consulta con caché cuesta unos 0,21 USD frente a unos 1,56 USD...
  • Para tareas por lote, si aún no tienes confirmado un descuento, endpoint o contrato concreto, conviene presupuestar primero con el precio público síncrono y ajustar después con la tarifa real aplicable.

大家也會問

「Claude Opus 4.7 API: cómo estimar el coste en documentos largos, conversaciones y batch jobs」的簡短答案是什麼?

Claude Opus 4.7 cuesta, en la Claude API pública, 5 USD por millón de tokens de entrada y 25 USD por millón de tokens de salida; para documentos de un solo uso basta con aplicar esa fórmula base.[2]

最值得優先驗證的重點是什麼?

Claude Opus 4.7 cuesta, en la Claude API pública, 5 USD por millón de tokens de entrada y 25 USD por millón de tokens de salida; para documentos de un solo uso basta con aplicar esa fórmula base.[2] En documentos largos o conversaciones repetidas, el prompt caching cambia mucho el presupuesto: en un ejemplo con un documento de 300k tokens, una segunda consulta con caché cuesta unos 0,21 USD frente a unos 1,56 USD...

接下來在實務上該怎麼做?

Para tareas por lote, si aún no tienes confirmado un descuento, endpoint o contrato concreto, conviene presupuestar primero con el precio público síncrono y ajustar después con la tarifa real aplicable.

下一步適合探索哪個相關主題?

繼續閱讀「Claude Security 公測版:Anthropic 的企業程式碼漏洞掃描工具」,從另一個角度查看更多引用來源。

開啟相關頁面

我應該拿這個和什麼比較?

將這個答案與「Grok 4.3 API 解讀:1M 上下文、低 token 價格,xAI 想搶下哪個入口?」交叉比對。

開啟相關頁面

繼續深入研究

研究對話

研究問題

搜尋並查核事實:Claude Opus 4.7 的 API 價格怎麼算?長文件、長對話、批次任務預算要抓多少?

Studio Global AI12 個來源

附引用的答案

我查到的官方 Claude API 定價是:Claude Opus 4.7 為每百萬 input tokens $5、每百萬 output tokens $25,且官方公告明說它的價格與 Opus 4.6 相同。[2][11] 如果你要抓預算,我會用「同步 API 單價 + Opus 4.7 最多 35% tokenizer 膨脹 + 是否用 prompt caching」這三件事來算;批次任務的精確折扣百分比,這次我無法從已抓到的官方內容中可靠抽出,所以保守預算先不要把未驗證折扣算進去。 [2]

  • 官方單價怎麼算

    • 同步 Messages API:費用 = input tokens ÷ 1,000,000 × $5 + output tokens ÷ 1,000,000 × $25。[2]
    • Prompt caching 5 分鐘寫入:cached 部分改按 $6.25/MTok 計;1 小時寫入:$10/MTok;之後 cache hit / refresh:$0.50/MTok。[2]
    • Anthropic 也註明 Opus 4.7 換了新 tokenizer,同一段固定文字的 token 數最多可能比先前模型多 35%。[2]
  • 長文件預算怎麼抓

    • 單次分析 100k input + 5k output,約 $0.625。[2]
    • 單次分析 300k input + 8k output,約 $1.70。[2]
    • 單次分析 1M input + 10k output,約 $5.25。[2]
    • 如果你是從較舊的 Opus 版本升上來,想抓保守值,可先把 input token 預估乘 1.35;例如原本估 300k input,保守抓成 405k input,搭配 8k output 時約 $2.23。[2]
  • 長文件反覆問答,該不該用 cache

    • 例:300k token 文件,第一次建立 5 分鐘 cache,再加 2k 新問題與 2k 輸出,約 $1.935。[2]
    • 同一份文件在 cache 命中時,再問一次 2k 新問題、拿 2k 輸出,約 $0.21。[2]
    • 所以只要同一大文件會被反覆查問 2 次以上,prompt caching 通常就很值得。[2]
  • 長對話預算怎麼抓

    • 例:你每輪都帶 200k 歷史對話,再加 1k 新訊息,模型輸出 2k;如果不用 cache,每輪約 $1.055。[2]
    • 若先把那 200k 歷史做 5 分鐘 cache,第一次寫入那輪約 $1.305;之後命中 cache 的每輪約 $0.155。[2]
    • 如果使用者回覆間隔常超過 5 分鐘、但通常不超過 1 小時,1 小時 cache 可能更合理;同樣 200k 歷史的第一次寫入約 $2.055,之後命中時每輪仍約 $0.155。[2]
  • 批次任務預算怎麼抓

    • 精確 batch discount:Insufficient evidence。這次我沒辦法從已抓到的官方頁面內容中可靠核出折扣百分比,所以不建議你先把某個未驗證折扣寫進正式預算。
    • 保守抓法:先完全按同步 API 單價編列,之後若你再核到官方 batch 折扣,再把預算下修。
    • 例:10,000 筆任務,每筆 2k input + 500 output,先按同步價抓約 $225。[2]
    • 如果你不是直連 Claude API,而是走 AWS Bedrock / Vertex AI 的 regional 或 multi-region endpoint,官方定價頁說這類端點可能比 global endpoint 再貴 10%;Claude API 第一方預設是 global。[2]
  • 我會怎麼抓實務 buffer

    • PoC / 試跑:用理論值 × 1.2 到 1.5。
    • 正式上線但流量穩定:用理論值 × 1.35 到 1.6。
    • 從舊模型遷移到 Opus 4.7、又大量依賴長上下文:先用理論值 × 1.5 到 1.8,因為 tokenizer 膨脹會直接放大 input 成本。[2]
  • 一個簡單結論

    • 一次性長文件分析,直接用 $5 / $25 算就好。[2]
    • 長文件反覆追問、長對話多輪往返,一定要把 prompt caching 算進架構,不然成本會被重複送入的歷史內容吃掉。[2]
    • 批次任務若你現在就要簽核預算,先按「沒有 batch 折扣」抓最安全。

如果你要,我下一則可以直接幫你做一個「輸入文件大小、每輪對話長度、每日任務量」的 Opus 4.7 預算試算表。

來源

  • [2] Pricing - Claude API Docsplatform.claude.com

    The "Base Input Tokens" column shows standard input pricing, "Cache Writes" and "Cache Hits" are specific to prompt caching, and "Output Tokens" shows output pricing. Prompt caching multipliers apply on top of fast mode pricing. Fast mode is not available w...

  • [11] Introducing Claude Opus 4.7 - Anthropicanthropic.com

    Skip to main contentSkip to footer. Developers can use claude-opus-4-7 via the Claude API. . . ![Image 5: logo](

  • [12] Anthropic.Claude Opus 4 7 Pricing & Specs | AI Models | CloudPricecloudprice.net

    Claude Opus 4.7is a textmodel fromAWS Bedrock logoAWS Bedrock with a context window of 1.0M tokens and max output of 128K tokens. claude-opus-4-7 Anthropic logoAnthropic Text 5.00 25.00 1.0M 128K yes yes . anthropic.claude-opus-4-7 AWS Bedrock logoAWS Bedro...