AntwortenVeröffentlichtletzte WocheLast edited vor 5 Tagen16 Quellen

Open-Source-Tool ASSERT: Microsofts Geheimwaffe gegen unkontrollierte KI-Agenten

ASSERT macht Schluss mit generischen KI Benchmarks: Das Open Source Tool verwandelt Ihre produktspezifischen Regeln in natürlicher Sprache direkt in ausführbare, bewertbare Test Suiten – und spürt so Verstöße zuverläs... Das Framework generiert automatisch adversariale Tests und zeichnet jeden Werkzeugaufruf auf.

Suchen und Fakten prüfen mit Studio Global AI Mehr Trendseiten ansehen

682K0

Abstract visualization representing Microsoft ASSERT framework converting natural-language AI behavior policies into structured, scored test suites for agent evaluation — What is Microsoft's ASSERT framework, announced at Build 2026, and how does it convert natural-language AI behavior policies into structuredMicrosoft's ASSERT framework automates the translation of plain-English behavior rules into executable, scored evaluation suites.
KI-Prompt
Create a landscape editorial hero image for this Studio Global article: What is Microsoft's ASSERT framework, announced at Build 2026, and how does it convert natural-language AI behavior policies into structured. Article summary: Here is a concise answer based on the official Microsoft sources and trusted reporting.. Topic tags: general, general web. Reference image context from search candidates: Reference image 1: visual subject "# Build agents you can trust across any framework with open evals and a control standard. The gap is concrete: written policies do not translate into working runtime controls, eval" source context "Build agents you can trust across any framework with open evals ..." Reference image 2: visual subject "# Microsoft is making AI behavior testing easier for developers. Microsoft has released ASSERT, an open-source framework that turns plain-language AI behavior re
openai.com

Microsoft hat auf seiner Build-2026-Entwicklerkonferenz am 2. Juni 2026 das Framework ASSERT vorgestellt und als Open-Source-Projekt unter der Flagge „Responsible AI“ auf GitHub veröffentlicht . Das Kürzel steht für Adaptive Spec-driven Scoring for Evaluation and Regression Testing. Es löst ein drängendes Problem in der agilen KI-Entwicklung: Wie stellt man sicher, dass ein autonomer KI-Agent die spezifischen Regeln und Sicherheitsgrenzen eines Produkts respektiert, bevor er mit echten Nutzern oder sensiblen Systemen interagiert? Herkömmliche KI-Benchmarks – die etwa Hilfsbereitschaft, Giftigkeit oder allgemeine Genauigkeit messen – übersehen oft kritische Fehler im anwendungsspezifischen Verhalten, wie zum Beispiel die unerlaubte Auszahlung von Rückerstattungen oder die Weitergabe vertraulicher Daten an die falschen Empfänger . ASSERT schließt diese Lücke, indem es Verhaltensregeln in natürlicher Sprache als primären Input für die Evaluation behandelt – und nicht nur als nebensächlichen Kontext.

So verwandelt ASSERT Worte in Test-Suiten

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Suchen und Fakten prüfen mit Studio Global AI

Die Leute fragen auch

Wie lautet die kurze Antwort auf „Open-Source-Tool ASSERT: Microsofts Geheimwaffe gegen unkontrollierte KI-Agenten“?

Was sind die wichtigsten Punkte, die zuerst validiert werden müssen?

Was soll ich als nächstes in der Praxis tun?

Anders als herkömmliche Benchmarks, die nur allgemeine Faktoren wie „Hilfsbereitschaft“ oder „Toxizität“ messen, testet ASSERT die tatsächlichen, oft geschäftskritischen Verhaltensgrenzen, die Entwickler für ihre Anwe...

Quellen

Comments

0 comments

Loading comments...