RAMPART(Risk Assessment and Measurement Platform for Agentic Red Teaming) 係專為 AI agents 設計嘅測試框架。工程師可以把正常情境同攻擊情境寫成自動化測試。
RAMPART 最大特色係 原生支援 pytest。pytest 係 Python 生態中最常用嘅測試框架之一。
意味住開發者可以用同樣方式寫:
對工程團隊嚟講,呢個設計大幅降低導入門檻,因為唔需要學一套全新工具。
RAMPART 可以模擬 AI agent 在真實環境可能遇到嘅攻擊,例如:
AI 系統經常由安全團隊做 red teaming(紅隊測試) 去找漏洞。
RAMPART 的重點係:
將一次性漏洞發現,變成永久測試。
例如,如果紅隊發現一個 prompt injection 可以令 agent 洩露資料,工程師可以把該場景寫成 回歸測試(regression test),確保之後更新模型或提示詞時唔會再出現同樣問題。
同傳統軟件唔同,AI agent 嘅行為通常 唔完全 deterministic(非確定性)。
即係話:
由於測試可以在 CI/CD pipeline 中執行,企業可以設定安全門檻。例如當以下元素改動時自動測試:
如果話 RAMPART 係「測試工具」,咁 Clarity 就更似 設計階段的安全思考框架。
Microsoft 形容 Clarity 係一個 結構化的「設計討論板」,用來幫團隊回答一些重要問題,例如:
Clarity 不只在規劃階段有用。
當出現以下情況時,它同樣可以派上用場:
團隊可以用 Clarity 重新檢視設計假設,例如:
企業 AI agent 往往需要:
因此,一個 prompt injection 或錯誤工具調用,可能會導致真實營運風險,例如資料洩漏或系統被濫用。
Microsoft 推出 RAMPART 同 Clarity 的目標,就是把 AI 安全變成一種 持續工程實踐(engineering discipline):
Comments
0 comments