Соревнование CoderCup было задумано как первая публичная «битва» ИИ-агентов с независимым судейством. Несколько агентов создавали одно и то же приложение в равных условиях, а CLI от TestSprite выступал в роли объективного арбитра . Примечательно, что используемый в соревновании набор тестов с открытым исходным кодом принимает pull request'ы от сообщества, то есть любой вердикт публично привязан к доказательствам
.
Самый яркий результат этого состязания: даже лучший агент сломал 12% функций, которые до этого работали корректно. Эта цифра наглядно описывает проблему «катастрофического забывания» в агентном кодинге: добавляя новый функционал, ИИ-агенты «не осознают», какой из уже существующих функций они могут навредить
. Соревнование стало публичным доказательством того, что внешний автоматический шаг проверки — не просто полезная опция, а суровая необходимость для любого рабочего процесса с ИИ-агентами
.
npm install -g @testsprite/testsprite-mcp@latestnpm run devХотя сам CLI с открытым кодом только выходит на рынок, его материнская платформа уже стала весомой частью современных процессов разработки с использованием ИИ. По состоянию на март 2026 года, более широким набором продуктов для тестирования TestSprite пользовались почти 100 000 команд разработчиков, чтобы проверять код, сгенерированный ИИ, перед его отправкой в production . Новый CLI превращает эту возможность в простой шаг, выполняемый в терминале любым агентом по кодингу, делая автоматическую верификацию качества стандартной частью пайплайна агентной разработки
.
Comments
0 comments