Если нужен один основной AI coding agent на каждый день, разумно начать с Claude Code: его официальная документация явно покрывает instructions/memories, common workflows, best practices, расширения, платфор...
Для долгой локальной работы в репозитории, отладки и рефакторинга логичнее начать с Claude Code: Anthropic прямо описывает его как инструмент, который читает codebase, редактирует файлы и запускает команды [...
GPT 5.5 выглядит самым сильным выбором по сводному сигналу: Artificial Analysis ставит GPT 5.5 xhigh на 60, GPT 5.5 high на 59, а Claude Opus 4.7 Adaptive Reasoning Max Effort — на 57.[2]
Универсального победителя по доступным данным нет: бенчмарки и спецификации опубликованы не в сопоставимом виде, а часть чисел видна только в сторонних источниках [4][22][32][37].
Короткий вывод: GPT 5.5 стоит брать как универсальную отправную точку; Claude Opus 4.7 — для длинных исследований и финансовых документов; DeepSeek V4 — для массовых недорогих вызовов; Kimi K2.6 — если нужны...
GPT 5.5 опережает Claude Opus 4.7 в опубликованных OpenAI результатах ARC AGI: 95,0 % и 85,0 % против 93,5 % и 75,8 %, но эти оценки проводились с режимом рассуждения xhigh в исследовательской среде [6].