Aloita selkokielisistä säännöistä. Kehittäjät kuvaavat odotetut ja kielletyt toiminnot luonnollisella kielellä, jotka voivat olla peräisin tuotevaatimuksista, säädösdokumenteista, järjestelmäkehotuksista tai julkaisun tarkistuslistoista . Esimerkki: "Tämän tukiagentin ei tule myöntää yli 500 euron hyvityksiä ilman esimiehen hyväksyntää."
Laaja kielimalli tulkitsee määrittelyt jäsennellyiksi säännöiksi. ASSERT käyttää kielimallia tulkitakseen vapaamuotoiset kuvaukset ja tuottaakseen koneluettavan määrittelyn hyväksyttävistä ja ei-hyväksyttävistä toiminnoista .
Haastavien testitapausten luonti. Kehys luo järjestelmällisesti kohdennettuja skenaarioita, rajatapauksia ja syötteitä, joiden tarkoituksena on testata, rikkooko agentti asetettuja sääntöjä .
Testisarjan suoritus kohdeagenttia vastaan. ASSERT ajaa testit todellista agenttitoteutusta vasten ja tallentaa jokaisen välivaiheen ja työkalukutsun, jonka agentti tekee matkan varrella . Se on kehysriippumaton ja toimii muun muassa LangChainin, CrewAI:n, AutoGenin, LiteLLM:n ja OpenAI:n kanssa – kehittäjiä ei lukita Microsoft Foundryyn
.
Vastaanota pisteytetty ja jäljitettävä raportti. Jokainen testi tuottaa jäsennellyn tuloskortin, jossa on läpäisy/hylätty-tuomio ja yksityiskohtaiset perustelut tuomarimallilta. Koska koko suoritusketju säilytetään, kehittäjät voivat porautua siihen tarkkaan työkalukutsuun tai päätösvaiheeseen, jossa agentti teki virheen .
ASSERTin erottaa geneerisistä arviointityökaluista sen keskittyminen sovelluskohtaisiin käyttäytymisrajoihin. Agentti voi saada täydelliset pisteet avuliaisuuden ja totuudenmukaisuuden vertailuissa, mutta silti rikkoa tuotesääntöä, kuten "älä koskaan jaa asiakkaan sähköpostiosoitteita ulkoisille palveluille". ASSERT on rakennettu juuri tämän luokan virheiden havaitsemiseen . Microsoft asemoi kehyksen turvallisuuskeskeiseksi ja toteaa, että sen arviointimenetelmä on validoitu erityisesti turvallisuuden arviointia, ei pelkästään laatua, varten
.
ASSERTin rinnalla julkaistaan Agent Control Specification (ACS) , toinen Microsoftin avoimen lähdekoodin projekti, jonka avulla tiimit voivat määritellä siirrettäviä politiikkatiedostoja, joissa määritellään, mitä agentti saa tehdä ja mitä sen on ehdottomasti kiellettyä tehdä, milloin vaaditaan ihmisen hyväksyntä ja mitä todisteita on kirjattava . Tarkoitettu työnkulku on integroitu: kehittäjät ajavat ASSERTin ensin löytääkseen viat, soveltavat ajonaikaisia kontrolleja ACS:n avulla ja ajavat sitten ASSERTin uudelleen mitatakseen parannuksen ennen ja jälkeen -mittareilla
. Tämä silmukka – määrittele, arvioi, hallitse, arvioi uudelleen – antaa ohjelmistokehitystiimeille toistettavan prosessin agenttijärjestelmien koventamiseksi ennen käyttöönottoa.
Käytännössä kehittäjä voi määritellä säännön, kuten: "Tämä dokumenttitutkimusagentti ei saa lähettää sähköpostia yrityksen ulkopuolisille henkilöille, sen on rajoitettava luottamukselliset tiedot johtoryhmän jäsenille ja sen on tarjottava ytimekkäitä yhteenvetoja aiemman kontekstin kanssa." ASSERT loisi vastaavat haastavat testitapaukset automaattisesti, ajaisi ne ja liputtaisi jokaisen sääntörikkomuksen pisteytetyllä raportilla ja täydellä suoritusjäljellä .
Comments
0 comments