呢啲限制並唔止局限喺網絡安全範疇。個防護欄仲會針對同生物、化學,仲有好關鍵嘅——AI 模型蒸餾(Model Distillation)相關嘅查詢。就係最後呢點,引發咗另一波批評浪潮,有唔少開發者鬧 Anthropic 以「安全」為藉口,防止其他 AI 開發者利用 Fable 5 嘅輸出做訓練,實際上係反競爭行為 。
Anthropic 表示,呢啲分類器平均喺少過 5% 嘅工作階段(Sessions)入面觸發 。公司亦都公開承認咗有過度封殺嘅問題。一位公司發言人就同 Business Insider 講,呢啲安全措施「可能會標記安全、中立或者良性嘅請求」,但就為此辯護,話呢個係要將擁有如此強大底層能力嘅模型推出市面,所必須作出嘅取捨
。
Anthropic 嘅立場係,咁保守嘅防護欄係刻意為之嘅負責任選擇,而唔係程式錯誤(Bug)。公司認為,底層嗰個 Mythos 級模型,喺尋找同利用軟件漏洞等任務上太過熟練,如果無限制咁推出市面,會帶嚟災難性濫用嘅不可接受風險 。
喺佢哋眼中,防護欄係一種設計上嘅妥協——一方面俾公眾用到一個頂尖嘅推理、編程同寫作模型,同時又將佢最危險嘅潛在能力放喺一個沙盒(Sandbox)入面 。佢哋將過度封殺嘅問題,形容為要「又安全又快」咁推出強大模型嘅短暫代價,並承諾會隨時間改進呢啲分類器
。
喺 Fable 5 發布嘅同一日,Anthropic 亦都宣布咗 Claude Mythos 5。兩個模型共享完全一樣嘅底層架構同權重(Weights)——佢哋係同一個「大腦」。唯一嘅分別就係安全配置。Mythos 5 喺嗰幾個敏感領域移除咗分類器,俾佢發揮全部、無限制嘅能力 。
不過,Mythos 5 並唔係俾公眾用嘅。佢只限於一小撮經過審查嘅合作夥伴使用,包括政府機構同關鍵基礎設施營運商,透過一個名為 「玻璃之翼計劃」(Project Glasswing) 嘅倡議進行 。呢個美國政府支持嘅計劃,最初啟動時有 12 個創始合作夥伴,包括 AWS、Google 同 Microsoft 等科技巨頭,目的係俾「網絡防禦者」用 AI 大規模咁尋找同修補軟件漏洞
。隨住 Mythos 5 嘅推出,存取權限擴展到大約 40 個組織
。
下面個表就說明咗呢個根本性嘅分歧:
| 模型 | 開放程度 | 安全配置 | 用戶體驗 |
|---|---|---|---|
| Claude Fable 5 | 公眾(透過 API 同 Claude.ai) | 嚴格分類器運作中;敏感查詢會暗中轉交 Claude Opus 4.8 | 喺網絡/生物/化學話題上經常「跌 Watt」,用家唔知模型轉咗 |
| Claude Mythos 5 | 受限(僅限玻璃之翼計劃夥伴) | 分類器已移除;可用盡 Mythos 級完整能力 | 不受限制嘅存取,但只有幾十個預先審查過嘅組織可用 |
Anthropic 嘅 Fable/Mythos 分拆,係所謂「按能力分級嘅 AI 部署」最明顯嘅例子。喺呢種新模式入面,一個前沿 AI 並唔係單一產品;佢嘅完整能力係一種特權,而唔係必然,安全防護欄就係創造產品差異化嘅機制 。
呢種模式並唔係 Anthropic 獨有。其他領先嘅 AI 公司,包括 OpenAI,都採取咗類似做法,向國家安全同研究夥伴提供佢哋最先進模型嘅受限存取版本 。Fable/Mythos 嘅推出,具體化咗一個未來:最強大嘅 AI 能力,唔再係由技術門檻所把關,而係取決於「審查狀態」;安全協議同時兼任存取控制機制。呢種做法已經引發咗一場更廣泛嘅辯論,關於集中化、公平性,同「公眾」AI 安全究竟意味住啲咩。
Comments
0 comments