Универсального победителя нет: LLM Stats формулирует главный вывод так — бенчмарки выбирают не лучшую модель вообще, а подходящую рабочую нагрузку [2].
Если считать только API‑токены, самый дешёвый вариант в этих данных — gpt 5.1 codex mini: $2,25 за 1 млн входных + 1 млн выходных токенов без кэша против $30,00 у Claude Opus 4.7/4.6/4.5.
Универсального победителя по доступным данным нет: бенчмарки и спецификации опубликованы не в сопоставимом виде, а часть чисел видна только в сторонних источниках [4][22][32][37].
Абсолютного победителя нет: GPT 5.5 явно ведёт в Terminal Bench 2.0 — 82,7% против 69,4%, а Claude Opus 4.7 сильнее в SWE Bench Pro — 64,3% против 58,6%.
Единого победителя нет: Claude Opus 4.7 выше в SWE bench Pro — 64,3% против 58,6%, а GPT 5.5 заметно сильнее в Terminal Bench 2.0 — 82,7% против 69,4%; при этом режимы модели и тестовые стенды различаются [6...
Claude Opus 4.7 лидирует в задачах реальной разработки: 87,6% на SWE bench Verified и 64,3% на SWE bench Pro против 80,6% и 55,4% у DeepSeek V4 Pro в одном стороннем сравнении [28].
Единого «чемпиона» по всем задачам нет: в общей таблице Claude Opus 4.7 лидирует в GPQA Diamond с 94,2 % и SWE Bench Pro с 64,3 %, а GPT 5.5/GPT 5.5 Pro — в Terminal Bench 2.0 с 82,7 % и BrowseComp с 90,1 %.[4]
Короткий вывод: GPT 5.5 стоит брать как универсальную отправную точку; Claude Opus 4.7 — для длинных исследований и финансовых документов; DeepSeek V4 — для массовых недорогих вызовов; Kimi K2.6 — если нужны...
GPT 5.5 — самый убедительно подтвержденный универсал: 60 пунктов в доступном фрагменте Artificial Analysis Intelligence Index и 84,4 % в BrowseComp [2][3].
GPT 5.5 опережает Claude Opus 4.7 в опубликованных OpenAI результатах ARC AGI: 95,0 % и 85,0 % против 93,5 % и 75,8 %, но эти оценки проводились с режимом рассуждения xhigh в исследовательской среде [6].
Из пяти приложений наиболее четкое подтверждение GPT 5.5 есть у ChatGPT: OpenAI опубликовала страницу Introducing GPT 5.5 и GPT 5.5 System Card, а Help Center перечисляет инструменты, доступные для GPT 5.5 T...
Claude Opus 4.7 официально доступен: Anthropic описывает его как модель для программирования и ИИ агентов с контекстным окном 1 млн, но проверенные материалы не подтверждают безлимитный бесплатный доступ [3]...