AnswersPublishedlast weekLast edited 5 days ago16 sources

Näin Microsoftin uusi ASSERT-kehys nappaa tekoälyagenttien virheet jo ennen tuotantoa

ASSERT (Adaptive Spec driven Scoring for Evaluation and Regression Testing) on avoimen lähdekoodin kehys, joka muuntaa selkokieliset käyttäytymissäännöt suoritettaviksi ja pisteytettäviksi testisarjoiksi – se havaitse... Kehys luo automaattisesti haastavia testiskenaarioita, kirjaa jokaisen agentin työkalukutsun ja...

Search & fact-check with Studio Global AI Browse more Trending pages

682K0

Abstract visualization representing Microsoft ASSERT framework converting natural-language AI behavior policies into structured, scored test suites for agent evaluation — What is Microsoft's ASSERT framework, announced at Build 2026, and how does it convert natural-language AI behavior policies into structuredMicrosoft's ASSERT framework automates the translation of plain-English behavior rules into executable, scored evaluation suites.
AI Prompt
Create a landscape editorial hero image for this Studio Global article: What is Microsoft's ASSERT framework, announced at Build 2026, and how does it convert natural-language AI behavior policies into structured. Article summary: Here is a concise answer based on the official Microsoft sources and trusted reporting.. Topic tags: general, general web. Reference image context from search candidates: Reference image 1: visual subject "# Build agents you can trust across any framework with open evals and a control standard. The gap is concrete: written policies do not translate into working runtime controls, eval" source context "Build agents you can trust across any framework with open evals ..." Reference image 2: visual subject "# Microsoft is making AI behavior testing easier for developers. Microsoft has released ASSERT, an open-source framework that turns plain-language AI behavior re
openai.com

Microsoft julkisti ASSERT-kehyksen (Adaptive Spec-driven Scoring for Evaluation and Regression Testing) Build 2026 -kehittäjäkonferenssissaan 2. kesäkuuta 2026 ja julkaisi sen avoimen lähdekoodin projektina Responsible AI -lipun alla GitHubissa . Kehys pureutuu agenttipohjaisen tekoälykehityksen kasvavaan kompastuskiveen: miten varmistaa, että itsenäinen agentti noudattaa tuotteesi erityissääntöjä ja turvarajoja ennen kuin se on vuorovaikutuksessa oikeiden käyttäjien tai järjestelmien kanssa. Perinteiset tekoälyn vertailuarvot – jotka mittaavat avuliaisuutta, myrkyllisyyttä tai yleistä tarkkuutta – jättävät usein huomaamatta kriittiset virheet sovelluskohtaisessa käytöksessä, kuten sen, jos agentti myöntää luvattomia hyvityksiä tai jakaa luottamuksellisia tietoja väärien henkilöiden kanssa . ASSERT paikkaa tämän aukon käsittelemällä luonnollisella kielellä kuvattuja käyttäytymismäärittelyjä arvioinnin keskeisenä lähteenä, ei vain taustatietona.

Miten ASSERT muuntaa sanat testisarjoiksi

ASSERT noudattaa viisivaiheista putkea, joka muuntaa kehittäjän kirjallisen tarkoituksen pisteytettäväksi ja diagnosoitavaksi arvioinniksi:

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Näin Microsoftin uusi ASSERT-kehys nappaa tekoälyagenttien virheet jo ennen tuotantoa

Miten ASSERT muuntaa sanat testisarjoiksi

Search, cite, and publish your own answer

People also ask

What is the short answer to "Näin Microsoftin uusi ASSERT-kehys nappaa tekoälyagenttien virheet jo ennen tuotantoa"?

What are the key points to validate first?

What should I do next in practice?

Sources

Comments

Geneeristen vertailuarvojen tuolla puolen

Osa laajempaa luottamusarkkitehtuuria