如果只想抓住重点,可以这样理解:Claude Mythos Preview不是一个新的Claude应用,也不是一家新公司,而是Anthropic正在以预览或早期访问方式推进的Claude模型。公开资料里最醒目的两点是:Anthropic称它比Claude Opus 4.6显著更强;同时,Anthropic的红队材料披露了它在测试中表现出的自主漏洞利用能力。[4][
8] TechCrunch和Fortune的报道也都指向一种预览或早期访问式的推出,而不是面向所有用户的常规公开发布。[
2][
5]
它到底是什么
Anthropic的模型系统说明将其称为Claude Mythos Preview,TechCrunch也把Mythos描述为Anthropic一个强大新AI模型的预览版。[2][
8] 因此,在目前证据范围内,最稳妥的说法是:Mythos是Claude模型家族中的一个预览阶段模型。
这点很重要,因为“Claude Mythos”这个名字容易引发各种联想。现有来源并不支持把它理解成一家独立公司、一款单独的消费者应用,或一个任何人都能在Claude界面里自由选择的普通套餐档位。[2][
5][
8]
Anthropic怎么描述它的能力
Anthropic最明确的能力表述是:Claude Mythos Preview显著强于Claude Opus 4.6;而Opus 4.6被该系统说明称为Anthropic最近风险报告中讨论的最强模型。[8] 换句话说,Anthropic把Opus 4.6作为理解Mythos能力跃升的主要参照物。
但这里也需要留个分寸。Anthropic同时表示,就整体风险评估而言,Mythos Preview的风险画像与既有模型“实际上相似”;系统说明还称,部分多轮评测结果与Claude Opus 4.6、Claude Sonnet 4.6相比,在误差范围内相当。[8]
| 你可能关心的问题 | 公开证据 | 更稳妥的理解 |
|---|---|---|
| Mythos是否强于Opus 4.6? | Anthropic称Claude Mythos Preview显著强于Claude Opus 4.6。[ | 它被定位为整体能力提升,但这不等于它在每一种任务或每一个基准上都必然胜出。 |
| 它和Sonnet 4.6怎么比? | Anthropic称部分多轮评测结果与Sonnet 4.6、Opus 4.6在误差范围内相当。[ | Sonnet 4.6仍可作为参考,但Anthropic对Mythos能力跃升的主要对照是Opus 4.6。 |
| 它是否意味着全新的风险类型? | Anthropic称Mythos强于此前模型,但在整体风险评估中的画像实际上相似。[ | 能力更强,不自动等于每一类披露风险都发生了性质变化。 |
为什么网络安全成了焦点
关于Mythos最具体的公开技术细节,几乎都集中在漏洞和漏洞利用测试上。Anthropic的红队材料称,Mythos Preview能够针对已经修补的漏洞,全自主编写复杂的漏洞利用;材料还称,该模型曾全自主识别并利用FreeBSD中一个存在17年的远程代码执行漏洞,该漏洞可能让攻击者在运行NFS(网络文件系统)的机器上获得root权限。[4]
这些披露并不意味着Mythos已经作为“进攻型网络安全工具”向公众开放。它们真正说明的是:访问控制、监控、红队测试和滥用防范,会是这类模型推出时绕不开的核心议题。TechCrunch围绕安全问题报道Mythos,CrowdStrike的相关评论也强调:AI能力越强,对安全实践的要求越高。[1][
2]
普通用户现在能用吗
现有公开来源没有显示Claude Mythos Preview已经成为一个广泛可用的常规Claude选项。TechCrunch将其称为预览版;Fortune则报道称,在一次数据泄露暴露模型存在后,Anthropic已开始与早期访问客户测试该模型。[2][
5]
对开发者、企业采购团队和安全团队来说,更现实的做法是:不要把Mythos当作已经可直接部署的通用模型来规划产品路线,除非Anthropic发布明确的访问和部署指南。目前公开证据最扎实的部分,是它的模型定位、相对能力表述和安全测试结果,而不是广泛可用性。[2][
4][
5][
8]
如何看待“泄露”报道
Fortune报道称,一些存放在未加保护、可被公开搜索的数据存储中的草稿材料暴露了该模型的存在;这些草稿材料称新模型名为Claude Mythos,并称Anthropic认为它带来前所未有的网络安全风险。[5] 这是理解事件脉络的重要信息,但也需要谨慎阅读:相关说法来自媒体报道的草稿材料,而不是最终公开的产品页面。[
5]
相比之下,Anthropic自己的系统说明措辞更克制:它称Mythos Preview强于此前模型,但也表示就整体风险评估而言,其风险画像实际上相似。[8] 更合理的读法不是简单认为两类材料互相矛盾,而是看到两件事同时存在:Anthropic给出了较强的能力跃升表述;红队测试又披露了特别敏感的网络安全行为。[
4][
5][
8]
不要轻易做这几个假设
不要把Mythos当成Opus改名版
Anthropic直接将Claude Mythos Preview与Claude Opus 4.6进行比较,并称Mythos显著更强。[8] 因此,把它解释成单纯“换个名字”的说法,和现有证据并不匹配。
不要把“显著更强”理解成万能结论
Anthropic最强的公开说法,是它相对Opus 4.6的整体能力提升。[8] 但同一份系统说明也说,部分多轮评测与Opus 4.6、Sonnet 4.6在误差范围内相当;所以不能把这句话扩展成“它在所有任务上都碾压其他模型”。[
8]
不要把安全红队结果等同于公开攻击能力
Anthropic红队材料的重要性在于,它描述了测试环境中的自主漏洞利用行为。[4] 但这些材料本身并不能证明该模型已经面向公众开放,或允许不受限制地用于进攻性网络安全活动。[
2][
4][
5]
常见问题
Claude Mythos和Claude Opus是同一个模型吗?
不是。Anthropic将Claude Mythos Preview与Claude Opus 4.6进行比较,并称Mythos Preview显著更强。[8]
Claude Mythos是网络安全专用模型吗?
公开来源把Claude Mythos Preview识别为Claude模型预览,而不是一款独立的网络安全产品。[2][
8] 之所以网络安全成为讨论中心,是因为Anthropic的红队材料披露了测试中的自主漏洞利用和漏洞编写能力。[
4]
现在任何人都能使用Claude Mythos Preview吗?
没有。已引用的公开来源没有显示它是一个常规面向公众开放的Claude版本。TechCrunch称其为预览版,Fortune报道称,在数据泄露暴露模型存在后,Anthropic已开始与早期访问客户进行测试。[2][
5]
结论
Claude Mythos Preview值得关注,不只是因为Anthropic称它相对Claude Opus 4.6有显著能力提升,更因为红队测试披露了高级自主漏洞利用能力。[4][
8] 目前最稳妥的判断是:它是Anthropic的Claude预览阶段模型,并非一次普通的全面公开发布;围绕它最关键的问题,也许不是模型排行榜上的名次,而是更强AI能力如何被安全治理。[
1][
2][
4][
5][
8]




