Главная «фишка» ASSERT — фокус на специфичных для бизнеса правилах, которые зачастую упускают универсальные оценки. «Агент может блестяще проходить тесты на вежливость и правдивость, но при этом спокойно сливать email-адреса клиентов во внешние сервисы, — поясняют в Microsoft. — ASSERT создан именно для отлова подобных фатальных ошибок» .
В компании подчеркивают, что методология оценки, лежащая в основе фреймворка, валидирована исследователями именно для оценки безопасности, а не просто качества .
ASSERT — не одиночный инструмент. Вместе с ним Microsoft представила Agent Control Specification (ACS), еще один open-source проект, который позволяет командам описывать в едином файле, что агенту можно, а что категорически нельзя, когда требуется вмешательство человека и какие доказательства нужно записать в лог .
Задуманный цикл работ выглядит так: сперва разработчик запускает ASSERT, чтобы найти дефекты (например, утечку данных), затем с помощью ACS описывает правила контроля поведения, и наконец, снова прогоняет ASSERT, чтобы количественно измерить разницу «до и после» .
Такой подход — «специфицируй, оцени, контролируй, переоценивай» — дает инженерным командам надежный, воспроизводимый процесс «закалки» агентских систем перед тем, как пустить их в реальный мир.
Исходный код ASSERT доступен в репозитории github.com/responsibleai/ASSERT. На старте проект получил поддержку от CrewAI, Arize AI, LiteLLM, Pipecat и Pydantic .
Comments
0 comments