Kimi K2.6 видна на Hugging Face в пространстве moonshotai, а дерево файлов репозитория доступно для просмотра.
Главный сигнал — код: BenchLM ставит Kimi 2.6 на 13 е место из 110 в предварительном общем рейтинге с 83/100, а в coding/programming — на 6 е из 110 со средним 89,8; сам рейтинг помечен как provisional.[3]
Самый прямой маршрут — Kimi Open Platform: API совместим с OpenAI, можно использовать OpenAI SDK, указав base url=https://api.moonshot.ai/v1 и endpoint /chat/completions.
У Kimi K2.6 есть файл deploy guidance.md на Hugging Face и разделы Deployment и Model Usage на странице модели — этого достаточно, чтобы начинать POC в частном облаке или на собственных GPU серверах.[1][6]
Самые убедительные сигналы по Kimi K2.6 относятся к coding agent сценариям: SWE Bench Pro, HLE with Tools и Toolathlon.
Проверяемые числа сейчас идут от BenchLM: Kimi 2.6 — 13 из 110 в общем предварительном рейтинге с 83/100 и 6 из 110 в coding/programming со средним баллом 89,8.[4]
Утверждение про 13 часов не взято с потолка: Kimi Forum говорит о более чем 12 часах выполнения и 4 000+ вызовах инструментов, а другие источники пересказывают кейс с exchange core на 13 часов.[9][26][32]
Kimi K2.6 позиционируется как новейшая модель Kimi с акцентом на долгие coding задачи, agent сценарии и multimodal ввод.
Официально подтверждено: Kimi K2.6 позиционируется как модель с Agent Swarm, long horizon execution и сильными coding возможностями; на сайте Kimi также есть разделы Websites, Slides/PPT и Sheets/таблицы.[2]...
Для официального Moonshot API используйте base url https://api.moonshot.ai/v1 и chat endpoint /chat/completions; model ID безопаснее брать из GET /models в своём аккаунте.
Универсального победителя по открытым данным нет: выбирать стоит не по хайпу, а по цене принятого ответа, качеству, задержке и числу повторных запусков.
Не стоит читать эти данные как окончательный рейтинг «лучшей модели»: настройки вывода, даты оценки и методики у источников различаются.