這兩款被針對的模型,代表著 Anthropic 研究的巔峰,而且誕生才不到幾天。它們都在 2026 年 6 月 9 日發表。Claude Fable 5 被設計為具備廣泛安全護欄的前沿模型 ;Claude Mythos 5 則擁有相同底層模型,但拿掉了特定的網路安全防護限制,透過名為「玻璃翼計畫」(Project Glasswing)的美國政府合作專案,專門提供給一小群網路防禦者與基礎設施供應商使用
。
行政部門對外宣稱的擔憂,聚焦在一個潛在的「越獄」(jailbreak)漏洞。根據公開的公司聲明,政府僅向 Anthropic 提供了口頭證據,指出存在單一、狹隘且非普遍適用的越獄手法,據稱該手法涉及要求模型閱讀特定程式碼庫並修復軟體缺陷 。
對此,Anthropic 火力全開地提出反駁。該公司審查了政府的證據後斷定,該越獄漏洞所展現的能力早已廣見於其他可公開存取的模型,包括 OpenAI 的 GPT-5.5。不僅如此,Anthropic 還主張,資安防禦人員每天都在使用這類能力來維護系統安全 。
直接的衝擊是二元性的:Fable 5 和 Mythos 5 被強制關閉。
這個事件為該公司創造了一個超現實的法規矛盾困境。正當商務部認為這些模型太危險,不能讓任何外國人接觸的同時,五角大廈卻早就把 Anthropic 列入黑名單,認為該公司對政府使用而言風險太高,根本不該用 。
這場關閉事件凸顯了 AI 公司面臨的脆弱現實:一款模型可以在同一週內,先是與政府合作打造、接著公開發布,最後卻因為一個開發商自己認為微不足道且屬於業界常態的所謂漏洞,而遭強制召回。
Comments
0 comments