Câu trả lờiĐã xuất bảntuần trướcLast edited 5 ngày trước16 nguồn

Microsoft Ra Mắt ASSERT: 'Vị Cứu Tinh' Cho Các Lỗi AI Agent Trước Khi Lên Sóng

ASSERT (Adaptive Spec driven Scoring for Evaluation and Regression Testing) là một framework mã nguồn mở có khả năng chuyển đổi các quy tắc hành vi bằng tiếng Anh đơn giản thành những bộ kiểm thử thực thi và có chấm đ... Nó tự động tạo ra các kịch bản đối nghịch, ghi lại mọi lệnh gọi công cụ, và cung cấp chẩn đoán đ...

Tìm kiếm và kiểm chứng sự thật với Studio Global AI Duyệt thêm trang xu hướng

682K0

Abstract visualization representing Microsoft ASSERT framework converting natural-language AI behavior policies into structured, scored test suites for agent evaluation — What is Microsoft's ASSERT framework, announced at Build 2026, and how does it convert natural-language AI behavior policies into structuredMicrosoft's ASSERT framework automates the translation of plain-English behavior rules into executable, scored evaluation suites.
Prompt AI
Create a landscape editorial hero image for this Studio Global article: What is Microsoft's ASSERT framework, announced at Build 2026, and how does it convert natural-language AI behavior policies into structured. Article summary: Here is a concise answer based on the official Microsoft sources and trusted reporting.. Topic tags: general, general web. Reference image context from search candidates: Reference image 1: visual subject "# Build agents you can trust across any framework with open evals and a control standard. The gap is concrete: written policies do not translate into working runtime controls, eval" source context "Build agents you can trust across any framework with open evals ..." Reference image 2: visual subject "# Microsoft is making AI behavior testing easier for developers. Microsoft has released ASSERT, an open-source framework that turns plain-language AI behavior re
openai.com

Microsoft đã chính thức công bố ASSERT (viết tắt của Adaptive Spec-driven Scoring for Evaluation and Regression Testing - Chấm điểm Thích ứng dựa trên Đặc tả cho Đánh giá và Kiểm thử Hồi quy) tại hội nghị lập trình viên Build 2026 vào ngày 2 tháng 6 năm 2026, đồng thời phát hành nó dưới dạng mã nguồn mở trên GitHub với danh nghĩa "AI có Trách nhiệm" . Framework này giải quyết một điểm đau ngày càng lớn trong phát triển AI tác tử (agentic AI): làm thế nào để xác minh rằng một tác nhân tự hành sẽ tôn trọng các quy tắc và ranh giới an toàn cụ thể của sản phẩm trước khi nó tương tác với người dùng hoặc hệ thống thực tế. Các bài kiểm tra AI truyền thống—thường chỉ đo lường độ hữu ích, mức độ độc hại hoặc độ chính xác chung—thường bỏ sót những lỗi nghiêm trọng trong hành vi dành riêng cho ứng dụng, chẳng hạn như một agent tự ý hoàn tiền khi chưa được phép hoặc chia sẻ dữ liệu bí mật cho nhầm người nhận . ASSERT thu hẹp khoảng cách này bằng cách coi các đặc tả hành vi bằng ngôn ngữ tự nhiên là đầu vào quan trọng hàng đầu cho quá trình đánh giá, chứ không chỉ là ngữ cảnh nền.

Cách ASSERT Biến Ngôn Từ Thành Bộ Kiểm Thử

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Tìm kiếm và kiểm chứng sự thật với Studio Global AI

Người ta cũng hỏi

Câu trả lời ngắn gọn cho "Microsoft Ra Mắt ASSERT: 'Vị Cứu Tinh' Cho Các Lỗi AI Agent Trước Khi Lên Sóng" là gì?

Những điểm chính cần xác nhận đầu tiên là gì?

Tôi nên làm gì tiếp theo trong thực tế?

Không giống như các bài kiểm tra chung chung về độ hữu ích hay độc hại, ASSERT tập trung vào các ranh giới hành vi cụ thể của ứng dụng đánh giá liệu một agent có tuân thủ chính xác các quy tắc và ràng buộc sản phẩm do...

Nguồn

Comments

0 comments

Loading comments...