而且,這把限制之火燒得比想像中更廣。除了資安,任何涉及生物、化學的提問同樣會被攔截。最敏感的一點是,Fable 5 甚至封鎖了所謂的「模型蒸餾」請求。
所謂模型蒸餾,指的是利用一個模型的輸出來訓練另一個模型的技術。這項封鎖引發了另一波陰謀論:部分 AI 開發者直指 Anthropic 根本是以「安全」為藉口,行反競爭之實,防止別人用自家模型來強化對手 。
Anthropic 表示,這套觸發機制在平均不到 5% 的對話中會被啟動 。該公司也公開坦承了「誤殺」的問題。他們對《Business Insider》表示,這些安全措施「會連安全、中性、或良性的請求一起標記」,但強調這是將這麼強大的模型公諸於世,所必須承受的代價
。
面對排山倒海的批評,Anthropic 的立場始終如一:這不是 bug(錯誤),而是刻意的負責任抉擇。
因此,這些防護柵欄對 Anthropic 來說像是一種設計上的妥協——既能讓大眾體驗到最先進的推理、寫作與程式開發能力,同時又把最具破壞性的潛能鎖在沙盒裡 。他們把過度誤擋的狀況,視為「安全且快速」推出超強模型的短期陣痛,並承諾未來會持續微調這些分類器
。
就在 Fable 5 推出的同一天,Anthropic 也發表了它的孿生兄弟 Claude Mythos 5。它們共享完全一樣的底層架構與模型權重——用白話說,它們是同一個「大腦」。
但 Mythos 5 並不是給一般人用的。它透過一項名為 「Project Glasswing」(玻璃之翼計畫) 的美國政府合作方案,僅向一小群經過嚴格審核的夥伴開放,包括政府單位與關鍵基礎設施營運商 。這個計畫一開始只有 12 家創始夥伴(包含 AWS、Google、微軟等巨頭),讓「網路防禦者」能夠大規模利用 AI 尋找並修補漏洞
。隨著 Mythos 5 問世,這扇窄門也僅擴大到約 40 個組織
。
下方表格清楚呈現了這個涇渭分明的世界:
Fable 與 Mythos 的切割,堪稱「能力分級 AI 部署」的終極示範。在這個新規則下,一個頂尖 AI 不再只是一個單一產品,它的「完整力量」變成一種特權,而不是出廠標配。防護柵欄本身,就成了創造產品差異化的核心手段 。
Fable/Mythos 的組合拳,正式向我們揭示了一個未來:最強大的 AI 能力,不再由技術瓶頸把關,而是由你的「受信等級」決定。安全協定轉身一變,成了門禁卡。這也點燃了一場更大的論戰——關乎 AI 權力的集中化、公平性,以及所謂「公開 AI 安全」這四個字的真正意涵。
Comments
0 comments