不过,这份报告也承认外界能看到的细节很有限:Mythos 发现的漏洞中,超过 99% 当时还没有完成修补,因此大多数案例无法被外部读者独立检查 。这不代表 Anthropic 的说法一定有问题,但确实意味着公开验证空间有限。
便宜模型一方的关键论点,并不是“小模型已经等同于 Mythos 这样的自主智能体”。真正的论点是:AI 的网络安全能力可能是“参差不齐”的——一个模型在某些任务上表现平平,却可能在边界清晰、上下文充分的漏洞分析中表现得出人意料。
Tom’s Hardware 对发布后的争论也做了类似概括:Mythos 可能是网络安全领域最强的综合 AI 模型之一,但在一些漏洞发现和补丁相关任务上,便宜模型也能达到相近结果;同时,可靠性和可用性仍然是需要继续观察的问题 。
这里的区别非常重要。能在一段整理好的代码上指出漏洞,并不等于能自主进入一个网络环境、寻找路径、串联步骤、触发漏洞并完成一次模拟入侵。公开证据最有力支持的,是 Mythos 在后一类更长、更具智能体特征的流程中领先 。
从公开资料看,最合理的解释不是“模型单体能力”四个字就能说完,而是模型加上网络安全专用系统:工具、执行环境、访问权限、上下文选择、提示方式,以及安全专家的审核与干预。
Aisle 明确提出,真正的护城河不是模型本身,而是“把深度安全专业知识内置进去的系统” 。AISI 的评测也间接说明了环境设置的重要性,因为 Mythos 最强的表现,是在受控条件下、被明确指令并被赋予网络访问权限时观察到的
。
访问限制也是问题的一部分。Bain 将 Claude Mythos Preview 描述为一个具有严肃网络安全影响的前沿模型,并指出 Anthropic 将其发布限制在名为 Project Glasswing 的经审查伙伴计划中 。因此,现实中的比较并不是“哪个公开 API 更便宜”这么简单,而是:在现有模型、工具和专业能力条件下,能否复现同样的工作流
。
目前还没有一个干净的公开“同场竞技”基准,能在完全相同条件下比较 Mythos、低成本 API 和开放权重模型的价格与性能。AISI 是在受控设置中评估 Mythos,并将其与此前前沿模型进展比较 。Anthropic 提供了较详细但由开发方发布的红队证据
。Aisle 则是在选定展示漏洞上进行了更窄范围的反向测试
。
这些资料回答的是相关但不同的问题。真正理想的比较,需要把工具访问、代码上下文、网络权限、尝试次数、计算预算、漏洞执行规则和人工审核都控制住。没有这样的对照实验之前,无论是“Mythos 绝对不可替代”,还是“便宜模型已经完全追平”,都说得太早 。
Claude Mythos 的网络安全能力,在需要自主性和多步骤执行的场景里确实显得突出。可是,公开记录并不能证明它的底层网络安全推理能力是便宜模型完全无法触及的。
Comments
0 comments