截至目前的公開資料,並不能確認 GPT-5.5-Cyber 是一個已完整揭露訓練差異的全新基礎模型。較穩妥的說法是:它是一條圍繞 GPT-5.5 能力、針對資安工作流程放寬限制但加強管控的存取路徑。
這個差別很重要。對防禦者來說,價值未必只在「模型更聰明」,也可能在於能否合法、順暢地執行一般模型會視為敏感的資安流程。TechCrunch 報導,GPT-5.5 Cyber 可執行滲透測試、漏洞識別與漏洞利用等任務,但 OpenAI 正限制誰能使用它 。
最清楚的公開答案是:經審核的資安防禦者。
TechCrunch 報導,Sam Altman 表示 OpenAI 會開始把 GPT-5.5 Cyber 推給「關鍵資安防禦者」,而 OpenAI 的申請流程會要求申請者提供資歷與預定用途 。Benzinga 也將其描述為提供給有限數量資安防禦者的預覽,並對敏感工作流程採更強驗證與帳號控管
。
也就是說,多數 ChatGPT 使用者、一般開發者或企業,不應假設自己可以直接打開 GPT-5.5-Cyber 使用。本文引用的公開報導並未揭露完整資格規則、審核時間表、核准名單、定價或 API 條款 。
Claude Mythos Preview 是 Anthropic 在這場資安 AI 競賽中的對應角色。公開報導描述,Mythos 並未向一般大眾開放,而是透過 Project Glasswing 或封閉合作夥伴、白名單安排,用於防禦性資安工作 。
Mythos 最受矚目的公開能力訊號來自 AISI。AISI 表示,Anthropic 的 Claude Mythos Preview 早期快照相較過去前沿模型在資安表現上更進一步,並成為其第一個能端到端完成模擬企業網路攻擊演練的模型;AISI 估計,該多步驟任務若由人類完成大約需要 20 小時 。
根據目前公開紀錄,兩者的差異更像是「受控發放模式」與「評測訊號」的比較,而不是一般 SaaS 產品規格表的比較。
如果只看公開證據,現在還不能說誰明確勝出。Claude Mythos 的歷史里程碑更清楚:在 AISI 的說法中,它是第一個端到端完成企業網路攻擊模擬的前沿模型 。但同一份 AISI 說明也指出,OpenAI 的早期 GPT-5.5 檢查點已達到相近表現,意味著前沿實驗室之間的資安能力差距正在快速縮小
。Axios 也把 OpenAI 描述為在駭客相關測試中並未遠遠落後 Mythos
。
若問題改成「哪一個防禦團隊比較可能實際拿到」,OpenAI 的申請制預覽對某些防禦者可能較具操作性;但公開證據並沒有量化到底會有多少團隊拿到 GPT-5.5-Cyber 存取權 。對大多數資安從業者來說,現階段答案其實相同:最敏感的能力都被放在信任審查、合作夥伴或白名單機制後方
。
因此,這場競賽的策略重點已經改變:不只是誰的模型最強,也包括誰能把更強的資安能力導向可信任的防禦用途,同時不把同樣的能力交給不可信任使用者。OpenAI 的公開做法是申請式、經驗證的存取與更強帳號控制;Anthropic 的公開做法則是圍繞 Mythos 的合作夥伴或白名單模式 。
因為兩套系統都受到限制,未解問題反而特別重要:
GPT-5.5-Cyber 可以視為 OpenAI 把進階 GPT-5.5 資安能力交給經審核防禦者的受控通道。Claude Mythos Preview 則是 Anthropic 更緊密綁定合作夥伴與白名單的對應方案。
Comments
0 comments