触发原因: 网络安全研究员Katie Moussouris演示了只需输入**“修复此代码”**("Fix this code")三个英文词,即可让模型自主逆向工程并武器化软件漏洞,引发国家安全警报。Anthropic的投资方亚马逊在其内部安全审查后向白宫发出警报
。
2026年4月,Anthropic调查了一起指控:一小群人曾未经授权访问了早期的Claude Mythos预览模型——一个Anthropic自称过于强大、不宜公开发布的系统。这一事件预示了后来导致Fable 5被关闭的更广泛的扩散风险担忧。
OpenAI于2026年5月11日推出Daybreak——一项重大的网络安全倡议。同一天,谷歌威胁情报组披露了首例确认的利用AI构建零日漏洞的攻击案例。Daybreak将GPT-5.5模型层级(包括一个权限较宽松的“GPT-5.5-Cyber”红队测试变体)与Codex Security智能体以及超过20家安全合作伙伴(Cloudflare、CrowdStrike、Palo Alto Networks等)打包,以机器速度自动化漏洞发现、补丁验证和修复流程
。此举被广泛视为OpenAI对Anthropic早前Project Glasswing/Mythos产品的直接竞争回应
。
2026年5月1日,五眼联盟下属的六大网络安全机构(CISA、NSA、ASD ACSC、CCCS、NZ NCSC、UK NCSC)联合发布了**“谨慎采用自主AI服务”指南——这是首个针对自主AI智能体**的多国协同安全指导文件。该指南识别了五类风险(权限风险、设计与配置风险、行为风险、问责风险以及数据/运营风险),并警告说,那些“以难以预测、审计或控制的方式跨系统行动、决策和交互”的自主智能体,已在缺乏充分保障措施的情况下运行于关键基础设施之中
。这份5月份的指南为6月22日声明升级为更广泛、更紧迫的行动呼吁奠定了政策基础。
5月份的自主AI指南识别了系统性风险。Mythos访问事件和Fable 5中的“修复此代码”漏洞证明,这些风险已经在现实世界的前沿模型中成为现实。OpenAI的Daybreak发布进一步加剧了竞争与安全动态。6月22日的声明代表了五眼联盟的统一结论:防御行动的窗口期已从数年缩短至数月。
Comments
0 comments