CoderCup 比賽被設計成史上第一個有公開裁判嘅 AI 編碼助手對決。喺呢個比賽入面,多個 AI Agent 喺相同條件下建立同一個應用程式,而 TestSprite CLI 就擔當一個客觀、中立嘅評分員角色 。比賽用嘅開源測試套件甚至接受社群嘅 Pull Request,所以每一個判決都有公開嘅證據支持,有晒 Link 俾你睇返。
呢次活動最令人震驚嘅發現係,就算係表現最好嘅 AI Agent,都破壞咗 12% 本來已經正常運作嘅功能。呢個數量化咗 Agentic 編碼入面一個叫「災難性遺忘」(Catastrophic Forgetting)嘅問題:當 Agent 建立新功能嗰陣,佢哋天生就缺乏一種意識,去知道自己可能破壞咗啲乜嘢現有功能。
npm install -g @testsprite/testsprite-mcp@latestnpm run dev雖然呢個全新開源嘅 CLI 啱啱先推出市場,但佢嘅母公司平台已經係現代 AI 驅動開發工作流程嘅一個重要部分。截至 2026 年 3 月,已經有接近 100,000 個開發團隊依賴 TestSprite 更廣泛嘅測試產品套件,喺 AI 生成嘅 Code 出街之前對佢進行驗證 。呢個 CLI 將呢種能力擴展到一個簡單、喺終端機執行嘅步驟,任何編碼助手都可以執行,令自動化品質驗證成為 Agentic 編碼流程嘅一個標準環節。
Comments
0 comments