Anthropic 在项目初期更新中披露了一组相当惊人的数据:
这些数字表明,AI 可能可以在极短时间内扫描并分析规模巨大的代码库,而传统人工审计往往需要数月甚至更长时间。
一些外部评估也显示该模型在安全研究任务中的表现相当强。
英国 AI Security Institute(AISI) 的评估显示,Claude Mythos Preview 在专家级网络安全 CTF(Capture‑the‑Flag)挑战中完成了 73% 的任务。
相关报告还描述了该模型的多项能力:
这意味着 AI 已经不只是辅助工具,而是在某些情况下可以独立完成完整的漏洞研究流程。
由于负责任漏洞披露(coordinated disclosure)的要求,大多数发现暂未公开。不过已有少数案例被提及:
Project Glasswing 实际上是一个跨行业安全联盟。
公开报道的参与机构包括:
这些组织使用该模型扫描自己的软件系统以及关键开源基础设施,以便在漏洞被攻击者利用前修复。
如果一个 AI 系统能够自动发现并利用零日漏洞,那么它可能会显著降低发动大规模网络攻击的技术门槛。
因此 Glasswing 的思路是:
先利用模型帮助防御方修补尽可能多的漏洞,然后再考虑更广泛的发布。
尽管数据看起来非常惊人,网络安全领域仍存在明显的质疑声音。
但与此同时,由于绝大多数漏洞尚未公开,安全社区仍无法全面验证这些结果。
可以确定的一点是:AI 正在迅速成为软件安全研究的重要工具——它可以扫描庞大的代码库、发现微妙漏洞,甚至生成攻击代码。至于 Claude Mythos 是否代表一次真正的技术突破,还是只是 AI 安全研究趋势中的领先一步,未来几年行业的实际应用情况将给出答案。
Comments
0 comments