Claude Mythos Preview并非一个狭义上的网络安全工具。它是一个通用大语言模型,是Anthropic公司旗下Claude系列的新一代继任者。它并不是专门被训练成一个黑客。然而,当其能力被评估时,结果甚至让它的创造者们也感到震惊。
Anthropic证实,Mythos Preview在所有主流操作系统和所有主流浏览器中,自主发现了数千个高危漏洞。这其中包括那些之前无人发现的未知(零日)漏洞。 一份报告形容它在21分钟内就产出了一份长达303页的漏洞发现成果
。
以往的AI模型有时也能发现漏洞,但几乎从未能自主构建出一个可用的漏洞利用程序。在一项将已知的Firefox JavaScript引擎漏洞转化为功能性Shell攻击程序的基准测试中,Mythos Preview成功了181次。而Anthropic此前最好的模型Claude Opus 4.6,成功率几乎为零 。这不是一次渐进式的改进——这是一个能力门槛的跨越。
研究人员采用了一种简单直接的框架:将目标代码容器化,在Claude Code上调用运行Mythos Preview,然后给它一段话的提示,要求它寻找漏洞。该模型随后便独立识别并针对此前未知的安全漏洞编写了攻击程序 。英国人工智能安全研究所(AISI)对Mythos进行了独立评估,并确认了其先进的网络能力
。
Anthropic明确表示,该模型的进攻性网络能力并非刻意训练出来的。它们“是代码、推理和自主性方面全面改进的下游产物”而“涌现”出来的 。那些让模型在修补漏洞方面更高效的改进,同样也使其在利用漏洞方面更高效。这具有重大治理意义:如果进攻能力是一般性推理能力的“涌现”属性,那么未来更强模型可能是无法在根本上不限制其智能的情况下做到完全安全的。
该公司创建了**“玻璃翼计划”**(Project Glasswing),这是一个严格受限的访问项目,将Mythos Preview的使用范围限制在约50家经过精挑细选的机构。这其中包括了像苹果、亚马逊云科技(AWS)、微软、谷歌、思科、CrowdStrike、博通、Palo Alto Networks和英伟达这样的主要科技公司,以及摩根大通这样的关键基础设施运营商。包括美国国家安全局(NSA)在内的美国政府实体也获得了访问权限 。目标很明确:优先加固世界上最关键的软件体系,让防御方在类似或更强的进攻性AI不可避免地扩散之前,获得一个“先手优势”。
Anthropic的逻辑简单直接:该模型对于大范围发布而言,实在太危险了。该公司承认,Mythos“目前在网络能力方面,远超任何其他AI模型”,并且它“预示着即将到来的一波模型浪潮,这些模型能以远超防御者反应速度的方式利用漏洞” 。若落入错误的人手中,它可能被用于策划对电网、医院和金融系统的协同网络攻击。
当Anthropic提议将访问权限从约50家机构扩大到120家时,局势进一步升级。白宫出面阻止了这一扩张——这是已知的首例美国政府基于政策考量(而非具体法律或法规)限制AI模型商业推广的实例 。政府官员担心该模型可能落入敌手,同时也对Anthropic是否有足够算力为扩大的用户群提供服务而不降低联邦关键合作伙伴的服务质量存疑。
与此同时,五角大楼宣布了与八家公司——OpenAI、谷歌、微软、AWS、英伟达、SpaceX、甲骨文和xAI——的涉密网络AI合作伙伴关系,并刻意将Anthropic排除在名单之外。这释放出该公司与美国国防机构之间关系紧张加剧的信号。
Claude Mythos的出现,在网络安全界点燃了一场紧迫的哲学辩论。人类漏洞研究员是否还有未来?还是我们正在见证一个终局的开始?
1. AI是增强,而非完全取代。 帕尔米奥蒂本人就在使用Claude Code来提高效率,同时依赖人类的技能来进行场景判断和创造性推理。许多研究人员认为,人类专家在高层次策略、理解系统的商业目的和逻辑,以及进行AI目前还无法复制的创造性攻击链式推理方面,依然不可或缺。
2. 访问控制暂时保住了人类的角色。 Mythos被锁在约50家机构内部。绝大多数漏洞赏金项目、渗透测试和漏洞评估,仍由人类研究员使用能力差得多的工具完成。这虽然改变了技术前沿,但并未瓦解现有的庞大行业。
3. 新领域和判断力。 人类在发现业务逻辑缺陷、进行微妙的社工评估,以及提供基于风险的、有场景判断的结论方面,仍然保有优势。这些是目前AI模型可能忽视或误判的。AI或许能发现一个技术上的缓冲区溢出漏洞;而一个人类研究员能告诉你,这个溢出在实际业务中是否真的重要。
1. 原始速度和规模超越人类极限。 Mythos可以在几分钟内吞入整个代码库,找到漏洞并写出攻击程序——这项工作可能需要一个熟练的团队花费数周甚至数月。某出版物形容它是“一个几乎能入侵地球上任何一台计算机的AI”,因为它同时在所有主流操作系统上发现了数千个未知漏洞 。
2. 顶尖人类竞赛正变成AI的展示场。 帕尔米奥蒂预测Pwn2Own等黑客大赛可能变得过时,这不仅仅是一种感觉——这是一个结构性的观察。如果一个模型能找到并组合利用原本需要多个顶尖团队才能搞定的漏洞,那么漏洞挖掘的经济学将发生根本性改变。
3. 成本和效率优势是压倒性的。 一个单一的AI系统可以扫描数百万行代码,将微小的漏洞连成致命的攻击链,并以任何人类都无法维持的规模运作。这从根本上改变了漏洞发现的可能性——不是因为人类效率低,而是因为他们在数量上无法竞争。
这场辩论不太可能得到一个干净的结论。更可能的是,近期的未来将走向分叉:一个内圈,由政府和公司严格审查的、使用Mythos这类工具的AI增强型防御者组成;以及一个广阔的“外圈”,在这里,绝大多数的安全工作仍然固执地、人肉地、手工地进行。而这两个圈子之间的距离,正在急速缩小。
Comments
0 comments