被限制的不仅是网安领域,还包括化学、生物学,以及一个极其敏感的领域:AI模型蒸馏。正是因为对AI蒸馏的控制,让Anthropic背上了另一重骂名:不少开发者指控其用“安全”当幌子,暗中阻碍其他AI开发者基于Fable 5训练新模型,这是典型的垄断行为 。
Anthropic声称这个分类系统平均仅在不到5%的会话中会被触发。公司发言人向Business Insider公开承认存在“误杀”,称这些措施“可能会将安全、中性甚至无害的请求也一并标记出来”,但坚持这是在将如此强大的底层模型公开化时的必要取舍。
面对质疑,Anthropic的立场很明确:这不是系统的Bug,而是一种刻意且负责任的“安全保守设计”。公司的理由是,Mythos级的底层模型在发现和利用软件漏洞方面能力过于强悍,如不加以限制就公开发布,将带来不可接受的巨大恶意利用风险 。
在他们看来,这套护栏是一种“设计妥协”——为公众提供最前沿的编程与创作能力,同时给最危险的底层能力加上一圈沙盒限制 。他们声称,过度过滤是快速发布强大模型必然要付出的短期代价,并承诺后续会优化分类器的精度
。
6月9日,Anthropic不仅发布了Fable 5,还同步发布了Claude Mythos 5。两者共享完全相同的底层架构与模型权重,本质上是同一个“大脑”。唯一的区别只在于安全配置。Mythos 5删除了所有上述领域的分类器,释放了全部、不受限制的能力。
但是,Mythos 5不对公众开放。它仅限一小部分经过严格审核的合作伙伴使用,其中包括美国政府机构、关键基础设施运营商,通过一个名为**“玻璃翅膀”项目(Project Glasswing)**的计划进行。 该项目最初由美国政府的支持,由AWS、谷歌、微软等12家科技巨头参与,旨在让防御方能利用AI在开源世界里大规模修复漏洞。
随着Mythos 5的发布,权限扩大至大约40家组织。
下面的表格清楚展现了这个根本性的割裂:
| 模型 | 开放程度 | 安全配置 | 用户体验 |
|---|---|---|---|
| Claude Fable 5 | 公众开放 | 开启严格分类器;敏感话题被静默路由到Claude Opus 4.8 | 在网安、生物、化学等领域体验极差,用户甚至不清楚发生了什么 |
| Claude Mythos 5 | 严格受限(仅限政府与关键伙伴) | 移除了分类器;释放全部Mythos级能力 | 无任何阻碍,但只有极少数通过安全审核的机构能用到 |
Anthropic这套“Fable / Mythos”的分裂发布,是能力分层部署最赤裸裸的例证。在这场新规则里,同一个顶尖AI不再是一个固定的产品。它的最强能力是一种特权,而不是标配,而“安全护栏”则充当了产品差异塑造与权限控制的工具。
这套策略并非Anthropic独创。包括OpenAI在内的其他领先AI公司,也都在用类似的方式,将最前沿的模型访问权限只留给国家安全与研究领域的特殊合作伙伴。 Claude Fable与Mythos的发布,清晰地指明了一个未来:最强大的AI能力,其大门不是由技术决定的,而是由你的资质审核状态决定的,“安全协议”成为隐形的门禁系统,这早已点燃了关于AI集权、公平性以及“公共安全”真实含义的激烈讨论。
Comments
0 comments