ASSERT sigue un proceso de cinco pasos que transforma la intención escrita de un desarrollador en una evaluación puntuada y con capacidad de diagnóstico:
Se empieza con políticas en lenguaje natural. Los desarrolladores describen los comportamientos esperados y prohibidos en lenguaje natural, basándose en los requisitos del producto, documentos de cumplimiento normativo, prompts del sistema o listas de verificación de lanzamiento . Por ejemplo: "Este agente de soporte no debe emitir reembolsos superiores a 500 € sin la aprobación de un gerente"
.
Un LLM interpreta las especificaciones y las convierte en reglas estructuradas. ASSERT utiliza un modelo de lenguaje de gran tamaño (LLM) para interpretar las descripciones en texto libre y producir una especificación legible por máquina de las acciones aceptables e inaceptables .
Generación de casos de prueba adversariales. El framework crea de forma sistemática escenarios específicos, casos límite e insumos diseñados para comprobar si el agente viola las políticas establecidas .
Ejecución de la batería de pruebas contra el agente objetivo. ASSERT ejecuta las pruebas contra la implementación real del agente, registrando cada paso intermedio y cada llamada a herramienta que el agente realiza en el camino . Es independiente del framework y funciona con LangChain, CrewAI, AutoGen, LiteLLM y OpenAI, entre otros; los desarrolladores no están atados a Microsoft Foundry
.
Se recibe un informe puntuado y trazable. Cada prueba produce una tarjeta de puntuación estructurada con un veredicto de aprobado o suspenso y una justificación detallada de un modelo juez. Dado que se conserva toda la trazabilidad de la ejecución, los desarrolladores pueden profundizar hasta la llamada a herramienta o el paso de decisión exacto donde el agente se equivocó .
Lo que distingue a ASSERT de las herramientas de evaluación genéricas es su enfoque en los límites de comportamiento específicos de cada aplicación. Un agente podría obtener una puntuación perfecta en benchmarks de utilidad y veracidad y aun así violar una regla de producto como "nunca compartir las direcciones de correo electrónico de los clientes con servicios externos". ASSERT está diseñado específicamente para detectar ese tipo de fallos . Microsoft posiciona el framework como una herramienta centrada en la seguridad, señalando que su metodología de evaluación fue validada específicamente para la evaluación de seguridad, no solo para métricas de calidad
.
ASSERT se lanza junto con la Especificación de Control de Agentes (ACS, por sus siglas en inglés), otro proyecto de código abierto de Microsoft que permite a los equipos definir archivos de políticas portátiles que especifican lo que un agente puede y no debe hacer, cuándo se requiere la aprobación humana y qué evidencia debe registrarse . El flujo de trabajo previsto es integrado: los desarrolladores primero ejecutan ASSERT para descubrir defectos, luego aplican controles en tiempo de ejecución a través de ACS y, finalmente, vuelven a ejecutar ASSERT para medir la mejora con métricas de antes y después
. Ese ciclo —especificar, evaluar, controlar y reevaluar— ofrece a los equipos de ingeniería un proceso repetible para robustecer los sistemas de agentes antes de su despliegue.
En la práctica, un desarrollador podría especificar una regla como: "Este agente de investigación de documentos no debe enviar correos electrónicos a personas ajenas a la empresa, debe limitar la información confidencial a los ejecutivos de nivel C y debe proporcionar resúmenes concisos con el contexto previo". ASSERT generaría los casos de prueba adversariales correspondientes de forma automática, los ejecutaría y marcaría cualquier violación de la política con un informe puntuado y trazabilidad completa .
ASSERT es de código abierto y está alojado en github.com/responsibleai/ASSERT. En su lanzamiento, recibió el respaldo de la comunidad por parte de CrewAI, Arize AI, LiteLLM, Pipecat y Pydantic .
Comments
0 comments