尽管 Mythos 在漏洞发现方面表现强劲,但现有证据也显示它 仍无法独立完成完整安全分析流程。
例如:
在实际企业环境中,这还可能带来新的问题:模型可以非常快地产生大量疑似漏洞,但安全团队仍需花时间验证,从而造成 漏洞筛查压力(triage overload)。
另一项重要发现是:Mythos 并非唯一达到这一能力水平的模型。
在该机构的网络安全测试套件中:
因此,从 成本与性能比(cost‑adjusted performance) 的角度看,Mythos 的优势可能取决于整体系统设计、工具链和访问控制,而不只是模型本身。
尽管能力仍有限,但政府和金融机构仍在争相测试类似 Mythos 的系统。
原因很简单:如果攻击者也能使用这些工具,防御方必须先拥有它们。
例如:
在金融、能源和政府基础设施等领域,这种技术被视为一种 “攻防双用”能力。
AISI 的研究还显示,AI 能够独立完成的网络安全任务长度正在迅速增加。
这种增长速度意味着:
综合政府评估与公开测试结果,Mythos 最合理的定位是:
一个高效率、能力强但具有双重用途的网络安全助手,而不是自动化的网络防御专家。
它在漏洞发现和复杂任务串联方面表现突出,但关键问题仍未完全解决,例如:
随着 GPT‑5.5 以及更多专业安全代理系统的出现,未来的竞争可能不再只是“哪一个模型最强”,而是 谁能构建最有效的 AI 安全工具链与工作流程。
Comments
0 comments