AnswersPublishedlast weekLast edited 5 days ago16 sources

Microsoft slipper ASSERT: Gjør norske regler om til automatiserte KI-tester som fanger feil før de skjer

ASSERT (Adaptive Spec driven Scoring for Evaluation and Regression Testing) er et rammeverk med åpen kildekode som oversetter retningslinjer for atferd, skrevet på vanlig norsk, til kjørbare, poengsatte testpakker – o... Verktøyet genererer målrettede scenarioer designet for å avsløre svakheter, logger hvert eneste...

Search & fact-check with Studio Global AI Browse more Trending pages

682K0

Abstract visualization representing Microsoft ASSERT framework converting natural-language AI behavior policies into structured, scored test suites for agent evaluation — What is Microsoft's ASSERT framework, announced at Build 2026, and how does it convert natural-language AI behavior policies into structuredMicrosoft's ASSERT framework automates the translation of plain-English behavior rules into executable, scored evaluation suites.
AI Prompt
Create a landscape editorial hero image for this Studio Global article: What is Microsoft's ASSERT framework, announced at Build 2026, and how does it convert natural-language AI behavior policies into structured. Article summary: Here is a concise answer based on the official Microsoft sources and trusted reporting.. Topic tags: general, general web. Reference image context from search candidates: Reference image 1: visual subject "# Build agents you can trust across any framework with open evals and a control standard. The gap is concrete: written policies do not translate into working runtime controls, eval" source context "Build agents you can trust across any framework with open evals ..." Reference image 2: visual subject "# Microsoft is making AI behavior testing easier for developers. Microsoft has released ASSERT, an open-source framework that turns plain-language AI behavior re
openai.com

Microsoft lanserte ASSERT (Adaptive Spec-driven Scoring for Evaluation and Regression Testing) under sin Build 2026-utviklerkonferanse 2. juni 2026. Rammeverket, som er gjort tilgjengelig som åpen kildekode under Responsible AI-paraplyen på GitHub, er skapt for å løse en økende hodepine innen utvikling av autonome KI-agenter: Hvordan kan du verifisere at en agent vil respektere dine spesifikke forretningsregler og sikkerhetsgrenser før den slippes løs på ekte brukere og systemer?

Tradisjonelle KI-tester – som måler hjelpsomhet, giftighet eller generell nøyaktighet – bommer ofte på kritiske feil i applikasjonsspesifikk atferd. Det kan være snakk om at en kundeservice-agent utsteder uautoriserte refusjoner, eller en internbot som deler konfidensiell informasjon med feil mottakere . ASSERT lukker dette gapet ved å behandle beskrivelser av ønsket atferd, skrevet på et naturlig språk som norsk, som en førsteklasses råvare for evaluering – ikke bare som bakgrunnskontekst.

Slik forvandler ASSERT ord til testregimer

ASSERT følger en femtrinns prosess som omformer en utviklers skrevne intensjoner til en poengsatt og etterprøvbar evaluering du faktisk kan feilsøke i:

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Microsoft slipper ASSERT: Gjør norske regler om til automatiserte KI-tester som fanger feil før de skjer

Slik forvandler ASSERT ord til testregimer

Search, cite, and publish your own answer

People also ask

What is the short answer to "Microsoft slipper ASSERT: Gjør norske regler om til automatiserte KI-tester som fanger feil før de skjer"?

What are the key points to validate first?

What should I do next in practice?

Sources

Comments

Mer enn generiske målemetoder

Del av en større helhet for pålitelig KI