公開資料未足以證明 GPT-5.5-Cyber 係一個完全獨立、訓練差異全部披露嘅 foundation model。比較穩陣嘅講法係:佢係一條圍繞 GPT-5.5 能力、專為網安場景而設嘅有限預覽通道。Benzinga 報道指,呢個預覽唔係用嚟「大幅提升」超越 GPT-5.5 嘅網安能力,而係訓練到對安全相關任務更寬鬆,同時對敏感 workflow 採用更強驗證同帳戶級控制 。
呢個分別好重要。對防守者嚟講,價值未必只在於「模型突然勁好多」,而係可以喺合規同受控環境下執行一般模型可能會視為敏感嘅合法安全工作。TechCrunch 報道指,GPT-5.5 Cyber 可執行滲透測試、漏洞識別,以及漏洞利用相關任務,但 OpenAI 正限制可使用人士 。
最清楚嘅公開答案係:經審核嘅網安防守者。TechCrunch 報道指,Sam Altman 表示 OpenAI 會開始向「關鍵網安防守者」推出 GPT-5.5 Cyber,而 OpenAI 設有申請程序,申請者需要提交資歷同計劃用途 。Benzinga 亦形容,GPT-5.5-Cyber 係提供予有限數量網安防守者嘅預覽,敏感 workflow 會配合更強驗證同帳戶控制
。
換句話講,一般 ChatGPT 用戶、普通開發者,甚至普通公司,都唔應該假設自己可以撳個掣就開到。現有公開報道未披露完整資格準則、審批時間、已獲批名單、收費,或者 API 條款。
Claude Mythos Preview 係 Anthropic 喺呢場網安 AI 競賽入面嘅受限對手。報道指 Mythos 並非公開提供予一般用戶,而係透過 Project Glasswing,或者封閉合作夥伴與白名單安排,用於防守性安全工作 。
Mythos 最有力嘅公開基準故事來自 AISI。AISI 表示,Anthropic Claude Mythos Preview 嘅早期 snapshot 相比之前 frontier models 喺網安表現上有明顯進步,並成為第一個可以端到端完成 AISI 模擬企業網絡攻擊演練嘅模型;AISI 估計,該多步驟任務若由人類完成大約需時 20 小時 。
按公開證據,暫時冇一個乾淨俐落嘅贏家。Claude Mythos 有最清楚嘅歷史里程碑:按 AISI 說法,佢係第一個完成模擬企業網絡攻擊演練全流程嘅 frontier model 。但同一份 AISI 評估亦指,GPT-5.5 一個早期 checkpoint 已達到相近表現,意味住頂尖 AI 實驗室之間嘅網安能力差距可能收窄得好快
。Axios 亦將 OpenAI 描述為喺黑客相關測試上離 Mythos 不遠
。
不過,能力同「你用唔用到」係兩件事。就算兩邊模型表現接近,實際可用性仍然取決於審核、合作夥伴身份同使用控制。OpenAI 嘅申請制如果比 Anthropic 合作夥伴網絡更廣,對某些防守者可能較有操作空間;但公開證據未有量化到底幾多團隊會獲得 GPT-5.5-Cyber 存取 。對大多數實務工作者嚟講,兩者答案其實相似:最敏感能力都放喺信任審核或合作夥伴門檻之後
。
網絡安全係最典型嘅攻防兩用 AI 場景。同一種能力,可以幫防守者發現同驗證漏洞;落喺攻擊者手上,亦可能變成入侵工具。AISI 嘅模擬企業網絡攻擊演練顯示,frontier models 開始能處理多步驟網安操作,而唔只係回答單一提示 。TechCrunch 報道指 GPT-5.5 Cyber 可協助滲透測試、漏洞識別同利用,亦解釋到點解 OpenAI 選擇限制存取,而唔係全面開放
。
所以,呢場競賽已經唔只係「邊個模型最強」。更關鍵係:點樣將更強網安能力派畀守門嘅人,同時避免同一槓桿落入唔可信用戶手上。按報道,OpenAI 嘅答案係申請制、身份驗證同更強控制;Anthropic 嘅答案則係圍繞 Mythos 嘅合作夥伴或白名單模式 。
因為兩套系統都受限,未知數反而特別重要:
GPT-5.5-Cyber 最適合被理解為 OpenAI 將高階 GPT-5.5 網安能力交畀經審核防守者嘅受控通道。Claude Mythos Preview 則係 Anthropic 更偏合作夥伴閘口嘅對應方案。AISI 結果帶出更大訊息:先進網安能力已唔再似係單一模型嘅偶然突破;至少兩間 frontier AI 開發者正接近相似水平,而「存取控制」本身已經成為產品設計一部分 。
Comments
0 comments