सादी अंग्रेज़ी नीतियों से शुरुआत करें। डेवलपर्स उत्पाद आवश्यकताओं, अनुपालन दस्तावेज़ों, सिस्टम प्रॉम्प्ट, या लॉन्च चेकलिस्ट से प्राकृतिक भाषा में अपेक्षित और निषिद्ध व्यवहारों का वर्णन करते हैं । एक उदाहरण: "यह सपोर्ट एजेंट मैनेजर की मंज़ूरी के बिना $500 से अधिक का रिफंड जारी नहीं करेगा"
।
LLM विनिर्देशों को संरचित नियमों में बदलता है। ASSERT एक भाषा मॉडल (LLM) का उपयोग करके फ्री-टेक्स्ट विवरणों की व्याख्या करता है और स्वीकार्य तथा अस्वीकार्य कार्यों का एक मशीन-पठनीय विनिर्देश तैयार करता है ।
प्रतिकूल (एडवर्सेरियल) टेस्ट-केस का निर्माण। फ्रेमवर्क व्यवस्थित रूप से लक्षित परिदृश्य, एज केसेस और इनपुट तैयार करता है, ताकि यह जांचा जा सके कि एजेंट बताई गई नीतियों का उल्लंघन करता है या नहीं ।
लक्षित एजेंट के खिलाफ टेस्ट सूट को चलाएं। ASSERT वास्तविक एजेंट कार्यान्वयन के खिलाफ टेस्ट चलाता है और एजेंट द्वारा उठाए गए हर मध्यवर्ती कदम और टूल कॉल को रिकॉर्ड करता है । यह फ्रेमवर्क-अज्ञेयवादी (फ्रेमवर्क-एग्नॉस्टिक) है और LangChain, CrewAI, AutoGen, LiteLLM, और OpenAI के साथ काम करता है — डेवलपर्स सिर्फ माइक्रोसॉफ्ट फाउंड्री तक सीमित नहीं हैं
।
एक स्कोर की गई, ट्रेस करने योग्य रिपोर्ट प्राप्त करें। हर टेस्ट एक संरचित स्कोरकार्ड तैयार करता है जिसमें पास/फेल का फैसला और एक जज मॉडल से विस्तृत तर्क शामिल होता है। चूंकि पूरा निष्पादन ट्रेस सुरक्षित रखा जाता है, डेवलपर्स ठीक उस टूल कॉल या निर्णय चरण तक पहुंच सकते हैं जहां एजेंट ने गलती की ।
ASSERT को आम मूल्यांकन उपकरणों से जो चीज़ अलग करती है, वह है इसका एप्लिकेशन-विशिष्ट व्यवहार सीमाओं पर ध्यान केंद्रित करना। एक एजेंट सहायकता और सत्यता के बेंचमार्क पर पूर्ण अंक प्राप्त कर सकता है, फिर भी "ग्राहक के ईमेल पते बाहरी सेवाओं के साथ कभी साझा न करने" जैसे उत्पाद नियम का उल्लंघन कर सकता है। ASSERT को विशेष रूप से इसी श्रेणी की विफलताओं को पकड़ने के लिए बनाया गया है । माइक्रोसॉफ्ट इस फ्रेमवर्क को सुरक्षा-केंद्रित बताता है, और यह भी नोट करता है कि इसकी मूल्यांकन पद्धति को विशेष रूप से सुरक्षा आकलन के लिए मान्य किया गया था, न कि केवल गुणवत्ता मीट्रिक्स के लिए
।
ASSERT के साथ एजेंट कंट्रोल स्पेसिफिकेशन (ACS) भी जारी किया गया है, जो माइक्रोसॉफ्ट की एक और ओपन-सोर्स परियोजना है। यह टीमों को पोर्टेबल नीति फाइलों को परिभाषित करने की सुविधा देती है जो यह निर्दिष्ट करती हैं कि एक एजेंट क्या कर सकता है और क्या नहीं, कब मानवीय मंजूरी की आवश्यकता है, और क्या सबूत लॉग किए जाने चाहिए । अभिप्रेत वर्कफ़्लो एकीकृत है: डेवलपर्स सबसे पहले खामियों का पता लगाने के लिए ASSERT चलाते हैं, ACS के माध्यम से रनटाइम नियंत्रण लागू करते हैं, और फिर सुधार को पहले-और-बाद के मीट्रिक्स के साथ मापने के लिए ASSERT को फिर से चलाते हैं
। यह चक्र — निर्दिष्ट करना, मूल्यांकन करना, नियंत्रित करना, पुनर्मूल्यांकन करना — इंजीनियरिंग टीमों को डिप्लॉयमेंट से पहले एजेंटिक सिस्टम को मजबूत करने के लिए एक दोहराने योग्य प्रक्रिया प्रदान करता है।
व्यवहार में, एक डेवलपर ऐसा नियम निर्दिष्ट कर सकता है जैसे: "यह दस्तावेज़ अनुसंधान एजेंट कंपनी के बाहर के लोगों को ईमेल नहीं भेजेगा, गोपनीय जानकारी को सी-लेवल अधिकारियों तक सीमित रखेगा, और पूर्व संदर्भ के साथ संक्षिप्त सारांश प्रदान करेगा।" ASSERT स्वचालित रूप से संबंधित प्रतिकूल टेस्ट केस तैयार करेगा, उन्हें चलाएगा, और एक स्कोर रिपोर्ट और पूर्ण ट्रेस के साथ किसी भी नीति उल्लंघन को चिह्नित करेगा ।
Comments
0 comments