Claude Opus 4.7 tiene una tarifa base fácil de recordar, pero calcular el gasto real de una app exige separar varias partidas. Anthropic señala que el modelo se usa en la Claude API con el ID claude-opus-4-7; los índices de precios de terceros también muestran como punto de partida USD 5 por millón de tokens de entrada y USD 25 por millón de tokens de salida. Si accedes por otra plataforma o proveedor, comprueba siempre su factura final.[7][
9][
19][
21]
Precio base: no metas todos los tokens en el mismo saco
En esta guía, MTok significa 1.000.000 de tokens. La página de precios de Anthropic separa tokens de entrada base, escrituras de caché, aciertos de caché y tokens de salida; por eso el cálculo conviene hacerlo por columnas, no con un único total.[19]
| Partida | Precio | Cómo leerlo |
|---|---|---|
| Tokens de entrada base | USD 5 / MTok | Entrada estándar enviada al modelo, cuando no se contabiliza como escritura o lectura de caché.[ |
| Tokens de salida | USD 25 / MTok | Tokens generados por Claude en la respuesta.[ |
| Escritura en prompt cache, TTL de 5 minutos | USD 6,25 / MTok | Primera escritura de contenido reutilizable en la caché con vida de 5 minutos.[ |
| Escritura en prompt cache, TTL de 1 hora | USD 10 / MTok | Escritura de contenido reutilizable con vida de 1 hora.[ |
| Lectura o acierto de caché | USD 0,50 / MTok | Lectura de contenido que ya estaba en caché.[ |
La consecuencia práctica: no basta con multiplicar total tokens por un precio medio. En Opus 4.7, entrada, salida, escritura de caché y lectura de caché tienen precios distintos; si tu producto usa prompt caching, tu modelo de costes debe separarlos.[19]
Fórmula si no usas prompt caching
Para una llamada simple, sin caché, el cálculo es:
coste = input_tokens / 1_000_000 * 5 + output_tokens / 1_000_000 * 25Ejemplo: una petición con 200.000 tokens de entrada y 20.000 tokens de salida costaría USD 1,00 + USD 0,50 = USD 1,50. Es solo la aritmética de la tarifa de Anthropic; no incluye posibles condiciones de otra plataforma si no llamas directamente a la API de Anthropic.[19]
Fórmula si usas prompt caching
Con caché de prompts, suma cada tipo de token por separado:
coste = base_input_tokens / 1_000_000 * 5
+ output_tokens / 1_000_000 * 25
+ cache_write_5m_tokens / 1_000_000 * 6.25
+ cache_write_1h_tokens / 1_000_000 * 10
+ cache_read_input_tokens / 1_000_000 * 0.50Si solo utilizas un TTL de caché, conserva únicamente la línea de escritura que corresponda. La documentación de streaming de Anthropic muestra que usage puede incluir campos como input_tokens, output_tokens, cache_creation_input_tokens y cache_read_input_tokens; la página de precios, por su parte, cobra de forma separada las escrituras y los aciertos de caché.[15][
19]
Antes de llamar al modelo: usa count_tokens
No estimes el coste por número de palabras, caracteres o páginas. Anthropic ofrece el endpoint /v1/messages/count_tokens para contar tokens antes de enviar un mensaje; acepta una estructura similar a la de Messages API, con soporte para system prompts, herramientas, imágenes y PDFs, y devuelve el total de tokens de entrada. Anthropic indica además que todos los modelos activos admiten el conteo de tokens.[18]
El flujo más fiable es construir exactamente el payload que mandarías a Messages API —incluidos system prompt, mensajes, herramientas, imágenes o PDF— y pasarlo primero por count_tokens. Así puedes estimar el gasto de entrada antes de ejecutar la llamada y fijar límites, alertas o presupuestos dentro de tu producto.[18]
Después de la respuesta: registra usage, no el texto final
La estimación previa sirve para decidir si lanzar la petición; la contabilidad real debe salir del campo usage de la respuesta. Los ejemplos de Messages API muestran input_tokens y output_tokens, y la documentación de streaming añade campos relacionados con la caché, como cache_creation_input_tokens y cache_read_input_tokens.[15][
17]
Si usas streaming, hay un detalle que evita muchos descuadres: los recuentos de usage dentro de message_delta son acumulados, no incrementos de cada evento. Si sumas todos los deltas como si fueran nuevos tokens, contarás de más.[15]
Para cierres mensuales: Usage & Cost Admin API
Guardar usage por petición es útil para límites en tiempo real, paneles internos o avisos al usuario. Para cierres mensuales, reparto por workspace o análisis histórico, Anthropic documenta la Usage & Cost Admin API, que ofrece acceso programático y granular a datos históricos de uso y coste, con desgloses por modelo, workspace y service tier.[16]
En otras palabras: usa los logs de cada request para controlar la aplicación; para conciliación financiera o reporting de equipo, apóyate en la API administrativa de uso y coste.[16]
Si vienes de Opus 4.6, rehaz el presupuesto de tokens
Opus 4.7 introduce un nuevo tokenizer. Anthropic advierte que, al procesar texto, puede usar aproximadamente entre 1x y 1,35x tokens respecto a modelos anteriores —hasta alrededor de un 35% más, según el contenido—, y que /v1/messages/count_tokens puede devolver un número distinto en Opus 4.7 que en Opus 4.6.[20]
Por eso, mantener la misma tarifa visible de USD 5/MTok de entrada y USD 25/MTok de salida no garantiza que tu factura sea idéntica tras migrar. Antes de pasar tráfico importante a Opus 4.7, vuelve a medir prompts de alto volumen, contextos largos, payloads con definiciones de herramientas y los flujos más caros con /v1/messages/count_tokens.[18][
19][
20]
Lista rápida de comprobación
- Usa el ID de modelo
claude-opus-4-7cuando llames a Claude API.[9]
- Antes de una release importante, ejecuta
/v1/messages/count_tokenssobre payloads representativos.[18]
- Guarda por separado tokens de entrada, tokens de salida, escrituras de caché y lecturas de caché; no almacenes solo un total genérico.[
15][
19]
- En streaming, recuerda que
message_delta.usagees acumulado y no debe sumarse evento por evento como si fueran incrementos.[15]
- Para cierres por equipo, workspace o tendencia histórica, usa Usage & Cost Admin API.[
16]
- Si migras desde Claude Opus 4.6 u otro modelo anterior, vuelve a medir el efecto del nuevo tokenizer sobre tus prompts reales.[
20]
- Si llamas a Opus 4.7 a través de un proveedor distinto de Anthropic, valida la tarifa efectiva en esa plataforma.[
7][
21]
En resumen: el precio base de Claude Opus 4.7 API es fácil de recordar —USD 5/MTok de entrada y USD 25/MTok de salida—, pero el coste correcto se calcula con count_tokens antes de enviar, usage después de responder, y una contabilidad separada para caché y tokenizer.[18][
19][
20]




