思科內部用來駕馭這些模型的工具是其自行開發的「思科鑄造廠安全規格」(Cisco Foundry Security Spec)。這個框架已在六款前線AI模型上進行了測試,確保其不與特定模型綁定。用思科自己的話來說:「如果模型是加速器,那麼這個框架就是引擎」。
思科是當前兩大旨在將前線AI「武器化」以用於防禦性網路安全的主要勢力中,居於核心的創始成員。
這項於2026年4月啟動的計畫,在極為嚴格的條件下,讓一組精心挑選的合作夥伴存取Claude Mythos Preview。其目標是在攻擊者有機可乘之前,找出並修補關鍵軟體中的漏洞。創始成員包含了AWS、蘋果、Google、微軟、輝達、CrowdStrike、Linux基金會,以及思科 。
這是OpenAI在2026年5月11日所公布,一個直接與「玻璃之翼」打對台的機構性回應。其根基建立在GPT-5.5與Codex Security之上,並包裝成三個模型層級,背後有一套為安全任務調校過的代理框架,用以實現大規模的自動化程式碼審查與修補驗證。思科與Cloudflare、CrowdStrike和Palo Alto Networks一同作為生態系夥伴加入 。
這兩項計畫反映了AI產業內部一個根本的哲學分歧。Anthropic主張,將最危險的模型置於嚴格控管之下,才是提升全球網路安全的最佳解方;而OpenAI則力推更廣泛的分層授權——甚至涵蓋各級政府機關——讓大量的AI輔助防禦者充斥整個領域 。
思科給出的行動理由很直白:由AI驅動的攻擊已不再是紙上談兵,防禦者不能再以人類的速度行動。當Anthropic宣布扣住Claude Mythos Preview時,它同時也揭露,該模型已經辨識出支撐網際網路與整體經濟的關鍵軟體基礎設施中存有弱點 。其背後的暗示相當清楚:如果防禦方不搶先使用這些模型,那麼敵人遲早會取得同等級的能力。
儘管在速度與規模上大張旗鼓,思科卻系統性地迴避了外界最關心的問題:這些模型到底找到了多少漏洞?多家媒體的報導都證實,思科「拒絕透露所發現的漏洞總數」,不只沒有統計數字,也未提供嚴重性分類,更沒有說明其中有多少是屬於重大或可被利用的漏洞 。
這份沉默本身就構成了一個顯而易見的公信力問題。假如模型真的發現了成千上萬個嚴重漏洞,公布數字將是整場演練最有力的正當性證明——但這也可能會驚動客戶與監理機關。而如果找到的漏洞相對稀少,那「八週抵八年」的說法便不攻自破。無論如何,思科選擇了將數字保密,同時大肆讚揚AI掃描的「變革性力量」。
在Cisco Live 2026上,確實有一項具體且可執行的改變。自7月起,思科將揚棄過往的隨機漏洞揭露模式,轉為一套規律化、可預測的排程做法。未來,該公司將於每個月的第一個與第三個星期三發布安全公告,並搭配為期七天的預先通知,預告該次發布將涵蓋哪些技術與平台 。
這項變革與AI掃描計畫直接相關。思科的產品安全事件回應小組(PSIRT)預期,由AI加速發現漏洞的結果,將使漏洞回報的數量大幅增加。每月兩次的節奏,旨在提供企業客戶規劃修補週期所需的可預測性,而非讓他們在面對突如其來的公告時手忙腳亂 。
Claude Mythos Preview在網路攻擊方面的能力,「遠超我們先前評估過的任何模型」。英國政府在2026年4月由大臣Liz Kendall與安全部長Dan Jarvis發給全英國企業領袖的公開信中,直接引用了這項發現,敦促董事會將AI增強的網路風險,視為治理層級的首要責任 。Mythos Preview在專家級的「奪旗賽」(CTF)任務中達到了73%的成功率,這是該機構所評估過的所有模型中的頭一遭
。
GPT-5.5完整地完成了AISI設計的32步驟企業網路攻擊模擬,一套該機構估計人類專家約需花上20小時的基準測試。此外,該模型也在AISI的95項狹義奪旗賽攻擊任務套組中,讓許多項目達到飽和,這意味著既有的基礎基準已不足以有意義地量測前線模型的網路風險 。在專家級的進階任務上,GPT-5.5的平均通過率約為71%,Mythos Preview則約為69%,皆遠高於前一代GPT-5.4的52%
。
整體趨勢正在加速:AISI發現,前線AI模型自主完成網路任務的能力,現在是每4.7個月就倍增一次,相較於該機構在2025年11月記錄的8個月倍增間隔,速度快上許多。而Claude Mythos Preview與GPT-5.5的表現,甚至還大幅超越了這條已變得更加陡峭的趨勢線 。
每4.7個月能力就加倍,這個趨勢的意義極為赤裸。假如這個趨勢持續,那麼在約莫一年半的時間內,AI系統將能自主完成當今需要一整個專家團隊,花費數週甚至數月才能完成的網路任務。AISI指出,兩款模型的更新版本已讓現有的95項任務評估套組達到飽和,造成了「高度不確定的時間範圍」,因為基準已無法再完整量測這些模型的能力上限 。
將思科的公告與AISI的評估並置,我們會看到一個產業已接受、並正在積極參與一場由AI助燃的防禦性軍備競賽。這些能掃描18億行程式碼的前線模型,在理論上同樣可被攻擊者用來尋找,並以比任何人類紅隊更快的速度去利用那些相同的漏洞。
無論是「玻璃之翼」還是「破曉」,其背後的邏輯都是:在攻擊能力進一步擴散前,將能力最強大的模型,優先提供給最負責任的組織,並置於嚴格控制之下,以便他們能趕在關鍵基礎設施遭攻擊前完成修補。思科這場18億行的掃描,正是這項命題迄今最大規模的一次真實世界驗證。然而,該公司對實際漏洞數量沉默不語的決定,留給業界的是一份誘人卻不完整的原理證明。
唯一能嗅出端倪的,或許是思科隨之而來的新制度:一套由AI驅動、全新的漏洞揭露節奏。這似乎強烈暗示了AI所發現的漏洞數量,已經大到足以迫使其永久性地改變運作方式。
Comments
0 comments