Публичных документов, которые подтверждают работу Kimi K2.6 сразу в Claude Code, Roo Code и Cline, сейчас недостаточно.
Открытые данные поддерживают более узкий вывод: Kimi K2.6 позиционируется для long horizon coding, UI/UX generation и multi agent orchestration, но воспроизводимого доказательства стабильной многодневной раб...
Kimi K2.6 — модель семейства Kimi K2 от Moonshot AI с публичной страницей на Hugging Face; источники связывают её с направлением agentic coding.[2][6]
Главный сигнал — код: BenchLM ставит Kimi 2.6 на 13 е место из 110 в предварительном общем рейтинге с 83/100, а в coding/programming — на 6 е из 110 со средним 89,8; сам рейтинг помечен как provisional.[3]
Самые убедительные сигналы по Kimi K2.6 относятся к coding agent сценариям: SWE Bench Pro, HLE with Tools и Toolathlon.
Утверждение про 13 часов не взято с потолка: Kimi Forum говорит о более чем 12 часах выполнения и 4 000+ вызовах инструментов, а другие источники пересказывают кейс с exchange core на 13 часов.[9][26][32]
Для официального Moonshot API используйте base url https://api.moonshot.ai/v1 и chat endpoint /chat/completions; model ID безопаснее брать из GET /models в своём аккаунте.
Claude Opus 4.7 сейчас выглядит сильнее по публичным цифрам для coding‑agent: VentureBeat сообщает 64,3% на SWE bench Pro, а Interesting Engineering приводит 58,6% для GPT‑5.5.[33][39]
GPT 5.5 вышла 23 апреля 2026 года; OpenAI описывает её как модель для сложной работы с кодом, онлайн исследованиями, документами, таблицами и инструментами.[22][15]
Строгого общего рейтинга для всех четырех моделей сейчас не получается: в одной таблице OpenAI Claude Opus 4.7 выше GPT 5.5 на SWE Bench Pro — 64,3% против 58,6%, зато GPT 5.5 выше на Terminal Bench 2.0 — 82...
Kimi K2.6 особенно выделяется в задачах программирования: MLQ.ai приводит 58,6 на SWE Bench Pro и 65,8% pass@1 на SWE bench Verified, но независимые оценки пока предварительные [8][9].
Kimi K2.6 — главный кандидат для первого теста в высокообъёмных coding agent сценариях: OpenRouter указывает 262 144 токена контекста и $0,75/$3,50 за 1 млн входных/выходных токенов, а effective pricing — $0...