На бенчмарке командной строки Terminal-Bench 2.1 модель показывает 74.6%. Она по-прежнему уступает GPT-5.5 (78.2%), но опережает собственного предшественника на 8.5 пунктов (у Opus 4.7 было 66.1%) . Для агентивного управления компьютером Opus 4.8 набирает 83.4% на OSWorld-Verified, незначительно обходя Opus 4.7 (82.8%) и GPT-5.5 (78.7%)
.
По уровню знаний в тесте GDPval-AA Opus 4.8 получает 1890 баллов Эло — значительно выше, чем GPT-5.5 (1769) и Gemini (1314) . А на мультидисциплинарном экзамене Humanity’s Last Exam модель показывает 57.9% с инструментами и 49.8% без них
.
Главный упор в Opus 4.8 сделан на правдивость. По внутренним оценкам Anthropic, модель примерно в четыре раза реже пропускает ошибки в коде без комментариев, чем Opus 4.7 .
Частота нежелательного поведения — от обмана до сотрудничества при злоупотреблениях — существенно ниже, чем у Opus 4.7, и сопоставима с показателями Claude Mythos Preview, который в компании считают самым «воспитанным» среди своих моделей . Разработчикам, которые полагаются на ИИ при ревью или написании продакшн-кода, такая честность критически важна: меньше риск получить уверенно сгенерированный, но ошибочный результат.
Самое заметное пользовательское нововведение — регулятор усилий на claude.ai и в интерфейсе Cowork . Теперь можно выбирать, сколько вычислительных ресурсов Клод потратит на ответ:
В Claude Code подняты лимиты запросов, чтобы компенсировать повышенный расход токенов на высоких уровнях усилий . Разработчики получают более гибкий выбор между скоростью, стоимостью и глубиной рассуждений.
Для тех, кто решает задачи промышленного масштаба, Anthropic запускает динамические рабочие процессы в исследовательском превью внутри Claude Code (доступно подписчикам Enterprise, Team и Max) .
Функция позволяет Claude спланировать операцию, а затем запустить и параллельно выполнить сотни субагентов в одной сессии. Результаты проверяются перед финальным ответом, что делает механизм пригодным для миграции кодовой базы на сотни тысяч строк .
Стандартные цены не изменились: $5 за миллион входных токенов и $25 за миллион выходных . Кэширование промптов и сопутствующие тарифы остались на уровне премиум-класса Opus
.
Гораздо интереснее ситуация с быстрым режимом. Fast mode для Opus 4.8 обеспечивает до 2.5 раз более быструю генерацию и теперь стоит $10 за миллион входных токенов и $50 за миллион выходных . Это в три раза дешевле, чем быстрый режим для Opus 4.6 и 4.7, где тарифы доходили до $30/$150
. Более того, Anthropic уже прекращает поддержку быстрого режима для Opus 4.6 и советует мигрировать на Opus 4.8 или 4.7
.
Чтобы активировать быстрый режим через API, разработчики указывают speed: "fast"claude-opus-4-8 и добавляют бета-заголовок fast-mode-2026-02-01 . Цена действует на всю длину контекстного окна (включая запросы свыше 200 тысяч токенов) и мультиплицируется с кэшированием промптов или локализацией данных
.
Модель уже доступна через Claude API по алиасу claude-opus-4-8 в стандартном и быстром режимах, а также с кэшированием промптов и батчевой обработкой . Все пользователи Claude Pro, Max, Team и Enterprise получают доступ немедленно
.
Параллельно с Opus 4.8 компания уточнила сроки выпуска моделей Mythos-класса. Напомним, с 7 апреля 2026 года Claude Mythos Preview был доступен лишь примерно 50 партнерам по защитной кибербезопасности через программу Project Glasswing . Причина — слишком высокие оффенсивные способности модели, из-за которых Anthropic отказалась от публичного релиза
.
Однако 28 мая формулировки изменились: компания объявила, что намерена выпустить Mythos-класс для всех клиентов в ближайшие недели . Это самый четкий сигнал с момента запуска Glasswing. Одновременно Anthropic раскрыла информацию о раунде H на $65 млрд при оценке в $965 млрд, подтверждая, что коммерческий запуск самого мощного модельного класса — вопрос скорого времени
.
Claude Opus 4.8 — инкрементальное, но важное обновление, которое дает три практических преимущества:
Если вы в раздумьях, стоит ли переключаться, лучший совет — протестируйте Opus 4.8 на собственных кодинг-задачах, агентных сценариях и длительных рабочих сессиях. Именно там самокоррекция, честность и продвинутая оркестрация дают наибольший выигрыш.
Comments
0 comments