Цена Claude Opus 4.7 в API на первый взгляд выглядит как простая пара чисел: $5 за миллион входных токенов и $25 за миллион выходных. Но в реальном продукте расчёт легко станет неверным, если складывать все токены в одну корзину. Anthropic указывает, что разработчики могут обращаться к модели по ID claude-opus-4-7 через Claude API; официальная таблица цен разбивает оплату на базовый ввод, вывод, записи в кеш и чтение из кеша. Сторонние ценовые каталоги тоже показывают стартовые $5/$25 за миллион токенов, но при подключении через другую платформу финальный счёт лучше сверять с её биллингом.[7][
9][
19][
21]
Ниже — практическая схема расчёта: что умножать на какую ставку, где заранее посчитать токены и что логировать после запроса.
Коротко: какие ставки закладывать
В этой статье MTok означает 1 000 000 токенов. Все ставки ниже указаны в долларах США за MTok.
| Категория | Цена | Как учитывать |
|---|---|---|
| Base input tokens | $5 / MTok | Обычные входные токены, которые не оплачиваются как запись или чтение кеша.[ |
| Output tokens | $25 / MTok | Токены, которые модель генерирует в ответе.[ |
| Prompt cache write, TTL 5 минут | $6.25 / MTok | Первичная запись переиспользуемого промпта в кеш с 5-минутным TTL.[ |
| Prompt cache write, TTL 1 час | $10 / MTok | Запись в кеш с часовым TTL.[ |
| Cache read / hit | $0.50 / MTok | Чтение уже закешированного содержимого.[ |
Главное правило: не берите «общее число токенов» и не умножайте его на одну усреднённую цену. У Opus 4.7 отдельно считаются input, output, cache write и cache read; если в приложении есть prompt caching, эти категории нужно хранить и умножать раздельно.[19]
Формула без prompt caching
Если кеширование промпта не используется, базовая формула такая:
Стоимость = input_tokens / 1_000_000 × 5 + output_tokens / 1_000_000 × 25
Например, если один запрос содержит 200 000 входных токенов и 20 000 выходных токенов, расчёт будет таким: 0,2 × $5 = $1,00 за ввод и 0,02 × $25 = $0,50 за вывод. Итого — $1,50. Это арифметика по ставкам Anthropic API и не включает возможные отличия биллинга у сторонних платформ.[19]
Формула с prompt caching
С кешированием формула становится построчной:
Стоимость =
base_input_tokens / 1_000_000 × 5
+ output_tokens / 1_000_000 × 25
+ cache_write_5m_tokens / 1_000_000 × 6.25
+ cache_write_1h_tokens / 1_000_000 × 10
+ cache_read_input_tokens / 1_000_000 × 0.50Если используется только один TTL, оставьте только соответствующую строку cache_write. Документация Anthropic по streaming показывает, что usage может включать поля input_tokens, output_tokens, cache_creation_input_tokens и cache_read_input_tokens; в прайсинге записи в кеш и попадания в кеш также выделены отдельно.[15][
19]
Токены до запроса: считайте payload, а не символы
Не стоит оценивать стоимость по количеству букв, слов или примерному числу символов. Для предварительного расчёта у Anthropic есть endpoint /v1/messages/count_tokens: он принимает структурированный ввод, похожий на запрос к Messages API, включая system prompts, tools, изображения и PDF, а в ответе возвращает общее число входных токенов. Token counting поддерживается всеми активными моделями.[18]
Практичный порядок такой: собрать ровно тот payload, который пойдёт в Messages API, включая системный промпт, историю сообщений, tools и вложения, затем отправить его в count_tokens. Так можно заранее оценить входную часть бюджета и поставить лимиты или предупреждения ещё до настоящего вызова модели.[18]
После запроса: реальный учёт берите из usage
Когда запрос завершён, лучше записывать usage из ответа API, а не пытаться восстановить стоимость по длине текста. Примеры Messages API показывают поля вроде input_tokens и output_tokens, а документация streaming также показывает кешевые поля cache_creation_input_tokens и cache_read_input_tokens.[15][
17]
Если вы используете streaming, есть важная ловушка: значения usage внутри message_delta являются накопительными, а не приростом по каждому событию. Если просто сложить все delta-события, можно задвоить одни и те же токены.[15]
Для месячной сверки используйте Usage & Cost Admin API
Логи отдельных запросов удобны для оперативного контроля в продукте, но для командного отчёта, разнесения расходов по workspace и анализа динамики лучше опираться на Usage & Cost Admin API. Anthropic описывает его как программный и детализированный доступ к историческим данным по API usage и cost; отчёты можно разбивать по model, workspace и service tier.[16]
Иными словами: на уровне приложения храните usage каждого запроса для лимитов и алертов, а для официальной сверки расходов используйте исторические данные Usage & Cost Admin API.[16]
При переходе на Opus 4.7 пересчитайте token budget
У Claude Opus 4.7 новый токенизатор. Anthropic указывает, что при обработке текста он может использовать примерно от 1× до 1,35× токенов по сравнению с предыдущими моделями — до примерно 35% больше, в зависимости от содержимого. Один и тот же ввод через /v1/messages/count_tokens может дать разные числа для Opus 4.7 и Opus 4.6.[20]
Поэтому неизменная витринная цена $5/$25 за MTok не гарантирует прежний счёт после миграции: если токенов стало больше, итоговая стоимость запроса тоже изменится.[19][
20]
Перед переходом с Opus 4.6 или более ранней модели имеет смысл заново прогнать через /v1/messages/count_tokens самые дорогие и массовые сценарии: длинный контекст, payload с tool definitions, большие системные промпты и workflows с высоким трафиком. После этого стоит обновить лимиты, алерты и внутренние калькуляторы стоимости.[18][
20]
Чек-лист для внедрения
- Проверьте, что в API используется model ID
claude-opus-4-7.[9]
- Перед важным релизом прогоните типовые payload через
/v1/messages/count_tokens.[18]
- Храните
input_tokens,output_tokens, cache write и cache read отдельными полями, а не одним total token count.[15][
19]
- При streaming помните:
message_delta.usage— накопительное значение, его нельзя слепо суммировать по событиям.[15]
- Для месячных отчётов, workspace-разбивки и исторической аналитики используйте Usage & Cost Admin API.[
16]
- При миграции со старой версии Claude заново проверьте, как новый токенизатор влияет на реальные промпты.[
20]
Итог простой: базовую цену Claude Opus 4.7 легко запомнить — $5 за MTok ввода и $25 за MTok вывода. Но точный расчёт строится не на одной средней ставке, а на трёх шагах: заранее считать ввод через count_tokens, после запроса логировать usage, а prompt caching и новый токенизатор учитывать отдельными строками бюджета.[18][
19][
20]




