AnswersPublishedlast weekLast edited 5 days ago16 sources

Microsoft ASSERT: Як прості правила англійською перетворюються на автоматичні тести для ШІ-агентів

ASSERT (Adaptive Spec driven Scoring for Evaluation and Regression Testing) — це open source фреймворк, який перетворює прості правила поведінки англійською мовою на виконувані набори тестів, виявляючи порушення політ... Він генерує змагальні сценарії, реєструє кожен виклик інструменту та надає оцінені звіти про про...

Search & fact-check with Studio Global AI Browse more Trending pages

682K0

Abstract visualization representing Microsoft ASSERT framework converting natural-language AI behavior policies into structured, scored test suites for agent evaluation — What is Microsoft's ASSERT framework, announced at Build 2026, and how does it convert natural-language AI behavior policies into structuredMicrosoft's ASSERT framework automates the translation of plain-English behavior rules into executable, scored evaluation suites.
AI Prompt
Create a landscape editorial hero image for this Studio Global article: What is Microsoft's ASSERT framework, announced at Build 2026, and how does it convert natural-language AI behavior policies into structured. Article summary: Here is a concise answer based on the official Microsoft sources and trusted reporting.. Topic tags: general, general web. Reference image context from search candidates: Reference image 1: visual subject "# Build agents you can trust across any framework with open evals and a control standard. The gap is concrete: written policies do not translate into working runtime controls, eval" source context "Build agents you can trust across any framework with open evals ..." Reference image 2: visual subject "# Microsoft is making AI behavior testing easier for developers. Microsoft has released ASSERT, an open-source framework that turns plain-language AI behavior re
openai.com

Уявіть собі ШІ-агента служби підтримки, який ідеально відповідає на запитання, але раптом, без жодного погодження, повертає клієнту $10 000. Або дослідницький бот, який надсилає конфіденційний звіт на зовнішню адресу. Саме такі катастрофічні збої, що їх часто пропускають стандартні тести, і покликаний виявити новий інструмент від Microsoft — ASSERT (Adaptive Spec-driven Scoring for Evaluation and Regression Testing). Його представили 2 червня 2026 року на конференції Build 2026 як open-source проєкт під прапором «Відповідального ШІ» на GitHub .

Головна проблема, яку вирішує ASSERT, — це розрив між «ввічливим» ШІ та «слухняним» ШІ. Традиційні еталонні тести вимірюють загальну корисність, токсичність або точність, але геть не враховують специфічні правила конкретного продукту. Наприклад, заборону ділитися email-адресами клієнтів із зовнішніми сервісами або ліміт на суму повернення без дозволу менеджера . ASSERT заповнює цю прогалину, перетворюючи текстові інструкції з поведінки на повноцінний вхідний матеріал для оцінювання, а не просто на фоновий контекст.

Як ASSERT перетворює слова на тестові набори

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Microsoft ASSERT: Як прості правила англійською перетворюються на автоматичні тести для ШІ-агентів

Як ASSERT перетворює слова на тестові набори

Search, cite, and publish your own answer

People also ask

What is the short answer to "Microsoft ASSERT: Як прості правила англійською перетворюються на автоматичні тести для ШІ-агентів"?

What are the key points to validate first?

What should I do next in practice?

Sources

Comments

Більше, ніж просто загальні тести

Частина більшого «стеку довіри»