claude-mythos-5): 受限访问的模型。它与Fable 5使用相同的底层模型和权重,但在特定领域移除了安全分类器。此模型不向公众开放,初始阶段仅限于获批的“玻璃翼计划”(Project Glasswing)合作伙伴使用Fable 5的定价显著低于前代旗舰产品的预览版:
对于订阅用户,Fable 5的免费访问有一个明确的截止日期:
6月23日之后,Fable 5仍可通过API、亚马逊云服务(AWS)和Vertex AI等云平台,以及按消耗量计费的企业版计划继续访问。Mythos 5则永远不会通过标准订阅提供,它始终被锁定在Anthropic的信任访问机制之后
。
区别于简单粗暴的拒绝回答,Fable 5使用一套外部的AI系统(分类器)来监控滥用和越狱尝试。当用户触发分类器时,请求不会被拒绝,而是悄然“降级”,由能力较弱的Claude Opus 4.8模型来处理,并会告知用户这一情况。
这种降级机制主要在以下三个领域生效:
公司承认该系统调校得较为保守,有时会标记无害的请求,但表示这些安全措施平均在不到5%的会话中激活。该系统经过了广泛的测试,包括一次外部漏洞赏金计划,在超过1000小时的测试中没有发现任何通用越狱方法
。对于在生成任何输出前就触发降级至Opus 4.8的提问,Anthropic承诺不会向用户收费,因模型切换产生的提示词缓存(prompt-cache)费用也会退还
。
伴随此次发布,一项关键的政策变更生效。Claude Fable 5和Claude Mythos 5都被指定为新数据保留政策下的“Covered Model”。这意味着它们必须遵守强制性的30天数据保留期,并且**不适用于某些企业客户可能依赖的“零数据保留”**协议。
Claude Mythos 5代表了未施加安全网的能力前沿。其推出通过一个可信访问计划管理:
Comments
0 comments