思科内部用于驱动这些模型的框架,名为“思科Foundry安全规范”(Cisco Foundry Security Spec),已在六款前沿AI模型上进行了测试,以确保其模型无关性。用思科自己的话来说:“模型是加速剂,框架才是引擎。”
思科是两项主要行业倡议的创始成员,这些倡议旨在将前沿AI武器化,用于防御性网络安全。
Anthropic的Project Glasswing: 于2026年4月启动,Project Glasswing旨在让精心挑选的合作伙伴在严格条件下访问Claude Mythos Preview。其目标是在攻击者利用漏洞之前,发现并修补关键软件中的漏洞。创始参与者包括AWS、苹果、谷歌、微软、Nvidia、CrowdStrike、Linux基金会以及思科等 。该倡议通过一个协调披露框架运作,将发现的漏洞负责任地报告给软件维护者
。
OpenAI的Daybreak: 于2026年5月11日公布,Daybreak是OpenAI对Project Glasswing的直接机构性回应。它基于GPT-5.5和Codex Security构建,在安全调优的智能体框架后集成了三个模型层级,旨在大规模自动化代码审查和补丁验证。思科与Cloudflare、CrowdStrike和Palo Alto Networks一同作为创始生态系统合作伙伴加入 。
这两项倡议代表了AI行业在哲学上的根本分歧。Anthropic认为,控制最危险模型的访问权是提升全球网络安全的最佳方式;而OpenAI则推动更广泛的分层访问——包括各级政府部门——以“淹没”区域,为防御方提供大量AI助手 。
思科公开的动机简单直接:AI驱动的攻击不再只是理论上的威胁,防御者不能以人力速度行动。当Anthropic宣布扣留Claude Mythos Preview时,它同时透露,该模型已经发现了支撑互联网和更广泛经济的关键软件基础设施中的弱点 。其潜台词很明确:如果防御团队不先发制人地使用这些模型,对手最终会获得同等能力。
思科将此次18亿行代码的扫描描述为一场与时间的赛跑。该公司指出,前沿模型“以前所未有的规模发现漏洞,而且这并非一劳永逸。这些模型会不断发现新的漏洞” 。通过在其整个产品组合上进行扫描,思科旨在抢在攻击者之前——那些恶意行为者可能会用类似模型来识别同样的弱点,但目的是恶意的。
尽管在速度和规模上大张旗鼓,思科却系统性地回避了最关键的问题:这些模型到底发现了多少漏洞?多份报告证实,思科“拒绝透露发现的漏洞总数”,没有提供任何统计、严重性分类,也未说明关键或可被利用的漏洞数量 。
这种沉默带来了一个明显的信誉问题。如果模型发现了数千个严重漏洞,披露这个数字将验证整个行动的合理性——但也可能使客户和监管机构感到震惊。如果发现的漏洞相对较少,那么“八周对八年”的说法便会站不住脚。无论如何,思科选择了在赞扬AI扫描“变革性力量”的同时,对此数字秘而不宣 。
在2026年思科全球用户大会上,确实出现了一项具体且可操作的改变:从7月开始,思科将放弃以往的临时漏洞披露模式,转向一种可预测的、按计划的披露方式。该公司将在每月的第1个和第3个星期三发布安全公告,并附带一份七天预告,列出每次发布将涵盖哪些技术和平台 。
这一变化的理由是直接与AI扫描计划挂钩的。思科产品安全事件响应团队(PSIRT)预计,AI加速的漏洞发现会显著增加发现漏洞的数量,每月两次的发布节奏旨在为企业客户提供规划补丁周期所需的可预测性,而不是让他们在突击安全公告中手忙脚乱。 。如果在某个发布窗口没有计划安全公告,思科也会就此进行沟通。
Claude Mythos Preview 在“网络攻击方面的能力,远超我们此前评估过的任何模型。”英国政府在一封2026年4月由国务大臣利兹·肯德尔(Liz Kendall)和安全大臣丹·贾维斯(Dan Jarvis)致所有英国商界领袖的公开信中,直接引用了这一发现,敦促董事会将AI增强的网络风险视为头等治理责任 。Mythos Preview在专家级夺旗(CTF)任务中取得了73%的成功率——这是该研究所评估过的所有模型中的首次。
GPT-5.5 端到端地完成了AISI设计的包含32步的企业网络攻击模拟,该研究所估计,这大约需要人类专家花费20小时。该模型还使AISI的95个狭义夺旗网络任务套件中的许多任务饱和,导致现有的基本基准不足以有意义地衡量前沿模型的网络风险 。在专家级高级任务上,GPT-5.5的平均通过率约为71%,相比之下,Mythos Preview约为69%,而上一代GPT-5.4约为52%
。
总体趋势正在加速:AISI发现,前沿AI模型自主完成网络任务的能力现在每4.7个月翻一番,相比该研究所2025年11月记录的8个月翻倍间隔大幅缩短。Claude Mythos Preview和GPT-5.5都明显超出了这条已经更陡峭的趋势线 。
这4.7个月翻一番的速度,其含义是严峻的。如果该趋势持续下去,在大约一年半内,AI系统就能自主完成目前需要人类专家团队花费数周或数月才能完成的网络任务。AISI指出,这两款模型的较新检查点已经让现有的95项评估任务套件饱和,产生了“高度不确定的时间范围”,因为基准测试已无法衡量模型能力的全貌。
思科的声明,结合AISI的评估,描绘了一幅行业已接受并积极参与AI驱动的防御性军备竞赛的图景。那些能扫描18亿行代码寻找漏洞的前沿模型,理论上也能被攻击者用来发现并利用同样的弱点,且速度比任何人工红队都快。
Project Glasswing和Daybreak的逻辑是,最好的防御就是先将最强大的模型,在严格的控制下,提供给最负责任的组织,以便它们能在攻击能力扩散之前修补关键基础设施。思科的18亿行代码扫描,是迄今为止对上述论点最大规模的真实世界检验。然而,该公司决定对实际漏洞数量秘而不宣,这给业界留下了一个诱人但不完整的原理验证——以及一个新的、由AI驱动的披露节奏,它暗示着漏洞发现的数量巨大,足以需要进行永久性的运营变革。
Comments
0 comments