觸發點: 網絡安全研究員Katie Moussouris示範,只需用「Fix this code」呢三個字嘅指令,就可以令模型自主逆向工程並武器化軟件漏洞,引發國家安全警報。Anthropic嘅投資者Amazon進行內部安全審查後通知白宮
。
2026年4月,Anthropic調查有關一小群人未經授權存取較早版本Claude Mythos預覽模型嘅指控——Anthropic本身形容呢個系統「威力過強,唔適合公開發布」。呢次事件預示咗後來觸發Fable 5被封殺嘅擴散風險。
OpenAI喺2026年5月11日推出Daybreak,一個重大嘅網絡安全計劃——同日Google嘅威脅情報小組披露首宗確認攻擊者利用AI建構零時差漏洞嘅案例。Daybreak將GPT-5.5模型層級(包括一個權限較寬鬆嘅「GPT-5.5-Cyber」紅隊測試變體)同Codex安全代理,以及超過20個安全合作夥伴(Cloudflare、CrowdStrike、Palo Alto Networks等)捆綁,用機器速度自動化漏洞發現、修補驗證同補救
。外界普遍認為呢個係OpenAI直接回應Anthropic之前嘅Project Glasswing / Mythos系列嘅競爭舉措
。
2026年5月1日,五眼聯盟旗下六個網絡安全機構(CISA、NSA、ASD ACSC、CCCS、NZ NCSC、UK NCSC)發布**「謹慎採用自主AI服務」(Careful Adoption of Agentic AI Services)——首份針對自主AI代理**嘅跨國協調安全指引。指引識別出五類風險(權限、設計與配置、行為、問責、數據與營運風險),並警告可以「自主行動、決策、跨系統互動,難以預測、審計或控制」嘅自主代理已經喺關鍵基礎設施中運作,但缺乏足夠防護
。呢份5月指引為6月22日嘅升級警告奠定咗政策基礎。
5月嘅自主AI指引已經識別出系統性風險。Mythos存取事件同Fable 5嘅「Fix this code」漏洞證實咗呢啲風險已經喺真實嘅前沿模型中實現。OpenAI嘅Daybreak推出加劇咗競爭同安全動態。6月22日嘅聲明係五眼聯盟嘅統一結論:防禦行動嘅窗口已經由幾年壓縮到幾個月。
簡單講: 五眼聯盟嘅警告唔係空穴來風,而係經過一系列真實事件——從AI模型被發現可以自主武器化漏洞,到政府史無前例地出手封殺——累積而成嘅結論。業界同政府都意識到,AI安全嘅時間已經唔等人。
Comments
0 comments