Open Weights Trending Pages | Studio Global

Open Weights Trending Pages | Studio Global

Популярные страницы

ТегиВсе Открытые веса7 Бенчмарки ИИ4 Кодинг-агенты3 ИИ-агенты3 DeepSeek5 OpenAI5 бенчмарки LLM3 Kimi6 Кодинг3 ИИ7 Бенчмарки2 LLM6 ИИ с открытым кодом3 Агенты2 Цены на ИИ1 агентный ИИ1 разработка ПО1 Anthropic4

Все Открытые весаx Очистить

Больше тегов

ТегиВыберите один тег

Выбрано

Открытые весаx7 Очистить

Топ

Все Открытые веса7 Бенчмарки ИИ4 Кодинг-агенты3 ИИ-агенты3 DeepSeek5 OpenAI5 бенчмарки LLM3 Kimi6 Кодинг3 ИИ7 Бенчмарки2 LLM6 ИИ с открытым кодом3 Агенты2 Цены на ИИ1 агентный ИИ1 разработка ПО1 Anthropic4

Бенчмарки ИИ Кодинг-агенты ИИ-агенты

Поиск по заголовкам

GPT-5.5, Claude Opus 4.7, Kimi K2.6 и DeepSeek V4: сравнение бенчмарков
3 недели назад22 источники
1.4M79K
Для терминальных coding агентов в общей таблице сильнее выглядит GPT 5.5 с 82,7% на Terminal Bench 2.0; для задач ремонта кода лидирует Claude Opus 4.7 — 64,3% на SWE Bench Pro и 87,6% на SWE Bench Verified...
Kimi K2.6: открытые веса или просто публичный репозиторий?
3 недели назад11 источники
1.6M94K
Kimi K2.6 видна на Hugging Face в пространстве moonshotai, а дерево файлов репозитория доступно для просмотра.
Kimi K2.6 в бенчмарках: почему все обсуждают код и агентные задачи
3 недели назад21 источники
1.4M77K
Главный сигнал — код: BenchLM ставит Kimi 2.6 на 13 е место из 110 в предварительном общем рейтинге с 83/100, а в coding/programming — на 6 е из 110 со средним 89,8; сам рейтинг помечен как provisional.[3]
GPT-5.5, Claude Opus 4.7, Kimi K2.6 и DeepSeek V4: где какая модель лидирует
3 недели назад18 источники
1.4M82K
Единого победителя нет: Claude Opus 4.7 лидирует в GPQA Diamond (94.2%) и HLE без инструментов (46.9%), GPT 5.5 — в Terminal Bench 2.0 (82.7%), а GPT 5.5 Pro — в HLE с инструментами (57.2%) и BrowseComp (90....
GPT‑5.5, Claude Opus 4.7, Kimi K2.6 и DeepSeek V4: какой ИИ выбрать в 2026 году
3 недели назад23 источники
1.4M79K
Универсального победителя нет: GPT‑5.5 сильнее выглядит в агентной работе с инструментами, Claude Opus 4.7 — в repo level coding, Kimi K2.6 — среди open weights coding моделей, а DeepSeek V4 стоит тестироват...
DeepSeek V4 против GPT‑5.5: каким бенчмаркам верить и какую модель выбрать
3 недели назад21 источники
1.5M89K
GPT‑5.5 проще оценивать для production API: OpenAI публикует model ID, окно 1 млн токенов, максимум 128K output, цену $5/$30 за 1 млн токенов и поддерживаемые инструменты [22].
GPT-5.5 против Claude Opus 4.7, DeepSeek V4 и Kimi K2.6: что реально видно по бенчмаркам
3 недели назад19 источники
1.6M93K
GPT 5.5 опережает Claude Opus 4.7 в опубликованных OpenAI результатах ARC AGI: 95,0 % и 85,0 % против 93,5 % и 75,8 %, но эти оценки проводились с режимом рассуждения xhigh в исследовательской среде [6].

Вы все посмотрели