Сообщение о 90 млн установок OpenAI Codex за неделю лучше читать как всплеск загрузок пакета @openai/codex, а не как 90 млн активных разработчиков.
Databricks сообщает о точности Genie выше 90% против 32% у ведущего кодингового агента на внутреннем бенчмарке реальных задач анализа данных; это сильный, но вендорский результат [3].
Claude Opus 4.7 лучше всего подтвержден публичными данными для coding и агентных задач: Vals AI дает ему 82,00% в SWE bench, а Anthropic сообщает 0,715 во внутреннем research agent benchmark [17][16].
Единого чемпиона по программированию здесь нет: Claude Opus 4.6 даёт самый сильный сигнал в SWE Bench Verified — около 79–81%, GPT 5.3 Codex выглядит лучше в cited Terminal Bench 2.0 среди моделей OpenAI, а...
Официальная дата выхода Claude Sonnet 4.8 не опубликована. В материалах Anthropic из приведённых источников подтверждён Claude Sonnet 4.6, запущенный 17 февраля 2026 года [2][11].
Данных о массовом уходе с GitHub нет; сильнее подтверждается другое — кризис доверия из за Copilot в общих рабочих процессах репозиториев [8][10].
Главная причина ограничений Copilot — переход от коротких запросов к долгим параллельным workflows с agents и subagents; с 1 июня 2026 года Copilot будет расходовать GitHub AI Credits [14][19].
Claude Code имеет смысл выбирать, когда разработчик хочет вести ИИ рядом с собой: читать репозиторий, править файлы, запускать команды и сразу проверять результат [15].
DeepSeek V4 Preview стоит тестировать в первую очередь тем, кому нужны контекст 1 млн токенов, coding agent workflows и выбор между V4 Pro и V4 Flash.[3]
Для большинства production нагрузок логичнее начинать с Claude Sonnet 4.6: в документации он указан как fast и стоит $3 за 1 млн input tokens и $15 за 1 млн output tokens.
Для терминальных coding агентов в общей таблице сильнее выглядит GPT 5.5 с 82,7% на Terminal Bench 2.0; для задач ремонта кода лидирует Claude Opus 4.7 — 64,3% на SWE Bench Pro и 87,6% на SWE Bench Verified...
Самый надежный общий срез для четырех моделей в доступных данных — Terminal Bench 2.0: GPT 5.5 набирает 82,7 %, Claude Opus 4.7 — 69,4 %, DeepSeek V4 Pro Max — 67,9 %, Kimi K2.6 Thinking — 66,7 %.[29][30][6]