DeepSeek V4 — это не одна «модель на 1 млн токенов», а линейка из V4 Pro и V4 Flash с разными профилями производительности и стоимости.
В доступных официальных материалах DeepSeek нет подтверждения, что V4 требует на 98% меньше общей VRAM.
DeepSeek V4 лучше понимать не как прорыв «с фейерверком», а как инженерное улучшение: V4 preview обещает большую эффективность и более длинные запросы, а V4 Pro заметно прибавила в тестах.[1][8]
DeepSeek V4 Preview стоит тестировать в первую очередь тем, кому нужны контекст 1 млн токенов, coding agent workflows и выбор между V4 Pro и V4 Flash.[3]
Claude Opus 4.7 — самая сильная общедоступная модель Claude у Anthropic по официальному позиционированию; среди ключевых характеристик — окно контекста 1 млн токенов и вывод до 128 тыс.
Claude Opus 4.7 официально поддерживает контекстное окно на 1 млн токенов и до 128 тыс.
Публичная цена Claude API для Opus 4.7: $5 за 1 млн input токенов и $25 за 1 млн output токенов; для длинного контекста отдельно считайте кеш и возможный рост числа токенов из за нового токенизатора.[2]
Claude Opus 4.7 заслуживает места в коротком списке для долгих AI агентов: Anthropic и Microsoft Foundry связывают модель с длительными агентными задачами и контекстом до 1 млн токенов.
В рассмотренных официальных материалах OpenAI нет подтверждения публичной GPT 5.5 Spud или отдельного long context бенчмарка для Spud; документы указывают на GPT 5.4 [46][58][59].
Для закупки API, длинного контекста и корпоративного развертывания Claude Opus 4.7 сейчас проще оценить: Anthropic раскрыла 1 млн токенов контекста, отсутствие long context premium в стандартном API, цену $5...