На этом фоне 1541 балл Qwen3.7-Max демонстрирует, что семейство моделей Qwen теперь конкурентоспособно на самом высоком мировом уровне. Модель не только обошла массовые американские аналоги, но и превзошла «недумающую» версию Claude Opus 4.6 по чистой производительности в программировании .
Этот результат ломает привычную картину, при которой первые места в рейтингах ИИ-кодеров делили между собой лишь две американские компании. Он показывает, что китайские ИИ-лаборатории теперь могут создавать модели, способные соревноваться на переднем крае практических задач разработки ПО. Быстрый взлёт Qwen3.7-Max вписывается в более широкий тренд: на арене ИИ-программирования сразу несколько китайских лабораторий — включая Moonshot с моделью Kimi K2.5 — недавно вошли в первую десятку .
Хотя результат в Code Arena привлёк наибольшее внимание, Qwen3.7-Max демонстрирует уверенные показатели и в других областях. Модель заняла десятое место в рейтинге Design Arena, показав мультимодальную оценочную силу, выходящую за рамки чистой кодогенерации . Кроме того, модель описывается как сочетающая способности к рассуждению с поддержкой длительных автономных задач — вплоть до 35 часов непрерывной работы и более 1000 вызовов инструментов
.
Для разработчиков и бизнеса вывод очевиден: следующее поколение ИИ-ассистентов для написания кода больше не привязано к одной стране или компании. Qwen3.7-Max от Alibaba вписала себя в короткий список передовых моделей, которые стоит тестировать в реальных процессах программной инженерии.
Comments
0 comments