ОтветыОпубликованона прошлой неделеLast edited 5 дней назад16 источники

Как фреймворк ASSERT от Microsoft превращает правила на русском в автопроверку ИИ-агентов

ASSERT превращает простые описания желаемого поведения на естественном языке в исполняемые тестовые сценарии, автоматически находя нарушения политик безопасности. Инструмент генерирует провокационные тесты, записывает каждый шаг агента и выставляет четкие оценки «зачет/незачет», работая с LangChain, CrewAI, AutoGen...

Искать и проверять факты с Studio Global AI Смотреть больше популярных страниц

682K0

Abstract visualization representing Microsoft ASSERT framework converting natural-language AI behavior policies into structured, scored test suites for agent evaluation — What is Microsoft's ASSERT framework, announced at Build 2026, and how does it convert natural-language AI behavior policies into structuredMicrosoft's ASSERT framework automates the translation of plain-English behavior rules into executable, scored evaluation suites.
Промпт ИИ
Create a landscape editorial hero image for this Studio Global article: What is Microsoft's ASSERT framework, announced at Build 2026, and how does it convert natural-language AI behavior policies into structured. Article summary: Here is a concise answer based on the official Microsoft sources and trusted reporting.. Topic tags: general, general web. Reference image context from search candidates: Reference image 1: visual subject "# Build agents you can trust across any framework with open evals and a control standard. The gap is concrete: written policies do not translate into working runtime controls, eval" source context "Build agents you can trust across any framework with open evals ..." Reference image 2: visual subject "# Microsoft is making AI behavior testing easier for developers. Microsoft has released ASSERT, an open-source framework that turns plain-language AI behavior re
openai.com

Пока все обсуждают, как сделать ИИ-агентов умнее, Microsoft решает куда более приземленную, но критически важную задачу: как заставить их неукоснительно соблюдать внутренние правила компании. 2 июня 2026 года на конференции Build компания представила ASSERT (Adaptive Spec-driven Scoring for Evaluation and Regression Testing) и выложила исходный код на GitHub под флагом «Ответственного ИИ» . Этот фреймворк призван устранить растущую головную боль разработки: как проверить, что автономный агент не натворит дел, например, не оформит возврат на $500 без одобрения или не перешлет закрытые данные не тому сотруднику .

Как слова превращаются в батарею тестов

В основе ASSERT лежит простой пятишаговый конвейер, который берет написанное разработчиком намерение и выдает на выходе измеримый и понятный результат:

Начинаем с правил на человеческом языке. Разработчики описывают ожидаемое и запрещенное поведение системы простым текстом — например, «Этот агент поддержки не должен оформлять возвраты на сумму свыше 5000 рублей без визы старшего менеджера». Требования берутся из ТЗ, документов комплаенс-отдела или просто из чек-листа перед запуском .

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Искать и проверять факты с Studio Global AI

Люди также спрашивают

Каков краткий ответ на вопрос «Как фреймворк ASSERT от Microsoft превращает правила на русском в автопроверку ИИ-агентов»?

ASSERT превращает простые описания желаемого поведения на естественном языке в исполняемые тестовые сценарии, автоматически находя нарушения политик безопасности.

Какие ключевые моменты необходимо проверить в первую очередь?

Что мне делать дальше на практике?

В отличие от общих тестов на «токсичность» или «полезность», ASSERT заточен под конкретные бизнес правила — например, «не возвращать деньги без одобрения менеджера».

Источники

Comments

0 comments

Loading comments...