| Anthropic |
| $5,00 |
| $0,50 |
| $25,00 |
| 1M токенов |
| 128K токенов |
| GPT-5.5 | OpenAI | $5,00 | $0,50 | $30,00 | Короткий контекст — базовый тариф; при превышении ~272K токенов включается повышенный | 128K токенов |
| GPT-5.5 Pro | OpenAI | $30,00 | — | $180,00 | Аналогично GPT-5.5 | 128K токенов |
| Gemini 3.5 Flash | $1,50 | $0,15 | $9,00 | 1 048 576 токенов | 65 536 токенов |
| Grok 4.3 | xAI | $1,25 | $0,20 | $2,50 | 1M токенов | — |
| DeepSeek V4 Flash | DeepSeek | $0,14 | $0,028 | $0,28 | 1M токенов | 384K токенов |
| DeepSeek V4 Pro | DeepSeek | $1,74 | $0,145 | $3,48 | 1M токенов | 384K токенов |
Claude Opus 4.8 и 4.7 сохраняют ту же базовую ставку, что и Opus 4.6, — $5 за вход и $25 за выход. Это продолжение политики Anthropic со времён поколения Opus 4.5 . Но не спешите радоваться: Opus 4.7 принёс новый токенизатор, который может превращать один и тот же текст вплоть до 35% лишних токенов по сравнению с Opus 4.6. Итог? Идентичные промпты становятся дороже при неизменной «официальной» цене
.
OpenAI тоже приготовил сюрприз для любителей длинных диалогов. У GPT-5.5 при превышении порога примерно в 272 тысячи входных токенов цена на вход подскакивает в 2 раза, а на выход — в 1,5 раза . Такой же ступенчатой логики придерживается xAI: для запросов до 200 тыс. токенов у Grok 4.3 действуют базовые расценки, а после — удвоенные
.
DeepSeek V4 Flash остаётся главным «демпингером». $0,14 за миллион входных токенов и $0,28 за выходные — это примерно на 97 % дешевле GPT-5.5 по выходу и почти на 70 % выгоднее Grok 4.3 по входу. Для высоконагруженных агентных систем это пока самый лёгкий кошелёк .
Prompt caching (кеширование повторяющихся частей промпта) — самый мощный инструмент оптимизации API-расходов. Если у вас есть системные инструкции или длинная история диалога, кешированные токены считаются в разы дешевле.
Anthropic, OpenAI и Google сошлись на скидке около 90 % для закешированных входящих токенов. У DeepSeek кеш-хит для V4 Flash стоит $0,028 за миллион токенов — против $0,14 за промах мимо кеша . Grok 4.3 даёт $0,20 за миллион при работе до 200 тыс. токенов
.
Batch API — следующий по значимости способ сэкономить. Обычно провайдеры снижают токен-ставки на 50 % в обмен на чуть менее оперативный ответ.
Чем шире контекстное окно, тем больше токенов уходит в запрос — а значит, растёт и счёт.
Comments
0 comments