Робота фреймворку складається з п’яти послідовних кроків, які перетворюють задум розробника на оцінену, діагностовану перевірку:
Починаємо з політик простою англійською. Розробники описують очікувану та заборонену поведінку природною мовою, спираючись на вимоги до продукту, документи про відповідність, системні підказки або контрольні списки запуску . Наприклад: «Цей агент підтримки не повинен оформлювати повернення на суму понад $500 без погодження менеджера»
.
Велика мовна модель (LLM) перетворює специфікації на структуровані правила. ASSERT використовує модель для інтерпретації описів у вільній формі та створення машиночитних специфікацій прийнятних і неприйнятних дій .
Генерація змагальних тестових сценаріїв. Фреймворк систематично створює цільові сценарії, межові випадки та вхідні дані, покликані перевірити, чи порушує агент заявлені політики .
Виконання набору тестів на цільовому агенті. ASSERT запускає тести на реальній реалізації агента, записуючи кожен проміжний крок і виклик інструмента, який робить агент . Фреймворк є агностичним і працює з LangChain, CrewAI, AutoGen, LiteLLM та OpenAI, серед інших — розробники не прив’язані до екосистеми Microsoft Foundry
.
Отримання оціненого звіту з можливістю відстеження. Кожен тест створює структуровану картку результатів із вердиктом «пройдено/провалено» та детальним обґрунтуванням від моделі-судді. Оскільки весь шлях виконання зберігається, розробники можуть «провалитися» до точного виклику інструмента або кроку рішення, де агент помилився .
Ключова відмінність ASSERT від інших інструментів оцінювання — це фокус на поведінкових межах, специфічних для конкретного застосунку. Агент може набрати ідеальний бал за корисність і правдивість, але при цьому порушити правило на кшталт «ніколи не передавати електронні адреси клієнтів зовнішнім сервісам». ASSERT створений саме для виявлення цього класу помилок . Microsoft позиціонує фреймворк як орієнтований на безпеку, зазначаючи, що його методологія оцінювання була валідована спеціально для оцінки безпеки, а не лише для метрик якості
.
ASSERT випускається разом зі Специфікацією керування агентом (ACS), ще одним open-source проєктом від Microsoft, який дозволяє командам визначати портативні файли політик, що вказують, що агенту дозволено, а що категорично заборонено робити, коли потрібне схвалення людини та які докази мають бути зареєстровані . Передбачуваний робочий процес є інтегрованим: розробники спочатку запускають ASSERT для виявлення дефектів, застосовують контроль під час виконання через ACS, а потім повторно запускають ASSERT, щоб виміряти покращення за допомогою показників «до і після»
. Цей цикл — визначити, оцінити, проконтролювати, переоцінити — дає інженерним командам повторюваний процес для зміцнення агентних систем перед розгортанням.
На практиці розробник може вказати правило на кшталт: «Цей дослідницький агент не повинен надсилати імейли людям за межами компанії, повинен обмежувати конфіденційну інформацію для керівників вищої ланки та надавати стислі резюме з попереднім контекстом». ASSERT автоматично згенерує відповідні змагальні тестові сценарії, запустить їх і позначить будь-яке порушення політики у звіті з оцінками та повним трейсом .
Comments
0 comments