幾項改進尤為突出。在能力方面,Opus 4.8 在代理編碼、跨領域知識工作,以及代理電腦操作上提供了更好的結果 。Claude Code 中的一項新的動態工作流程功能,使模型能夠協調數百個並行的子代理,進行橫跨數十萬行程式碼的程式碼庫級別遷移
。使用者還可以獲得可設定的努力程度——高、超高和最大——以及一個快速模式,其運作速度是過往快速模式的 2.5 倍,同時價格便宜了三倍
。
可靠性也獲得了重大升級。Opus 4.8 經過訓練,能更有效地標記自身工作中的不確定性。它讓自身程式碼中的缺陷在未被標記的情況下通過的可能性大約僅有前代產品的四分之一,解決了一個常見的挫敗感:高階模型自信地交付有缺陷的輸出 。Anthropic 將此描述為軟體工程領域模型誠實性的一項突破
。
至關重要的是,雖然 Opus 4.8 是一個更強大的自主代理,但它建立在與 Claude Opus 4 家族其他成員相同的 **ASL-3(AI 安全等級 3)**部署和安全標準之上。這些協議包括嚴格的安全防護措施,會自動封鎖顯示為禁止或高風險網路安全用途的請求,以及防止模型權重被老練的非國家行為者竊取的強大安全控制 。
Claude Mythos 預覽版的故事,正是使這一天有別於例行模型更新的真正關鍵。2026 年 4 月,Anthropic 揭露了該模型的存在,但明確拒絕公開發布。核心問題在於:Mythos 預覽版展現了在各大作業系統和網頁瀏覽器中,自主發現並利用零日漏洞的能力 。英國 AI 安全研究所(AISI)證實,Mythos 預覽版解決了 73% 的專家級奪旗(CTF)網路安全挑戰——這是一個讓先前模型望塵莫及的驚人成績
。
為了降低顯而易見的風險,Anthropic 創立了玻璃翼計畫,這是一項與約 50 個合作夥伴組織——包括 AWS、Apple、Google、Microsoft、CrowdStrike 和摩根大通——共同進行的受控倡議,這些組織將 Mythos 預覽版專門用於防禦性的漏洞發掘 。其成果是歷史性的。合作夥伴在全球最具系統重要性的軟體中,發現了超過一萬個高嚴重性或嚴重性漏洞,多數組織在加入的第一個月內,就各自發現了數百個此類漏洞
。在這些發現中,有 6,202 個被歸類為新穎、此前未知的零日漏洞
。這些發現橫跨關鍵基礎設施,並包含深層嵌入的缺陷,例如在 OpenBSD——這個世上最安全的作業系統之一——中找到的一個存在長達 27 年的漏洞
。
5 月 28 日,Anthropic 宣告此實驗成功,並宣布正準備在未來數週內,將 Mythos 級模型作為「全新級別的模型」發布給所有客戶 。玻璃翼計畫的成果提供了證據,證明在適當的防護措施下,這些模型可以被安全地用於防禦性網路工作。產業分析師報告指出,Claude Mythos 1 預計於 2026 年 6 月推出,與 Gemini 3.5 Pro 和 Grok 5 等其他主要模型一同登場
。
產品發布伴隨著財務上的震撼。同一天,Anthropic 宣布已完成 650 億美元的 H 輪融資,投後估值達到 9650 億美元,是其 2 月時 3800 億美元估值的兩倍多 。此輪融資由 Altimeter Capital、Dragoneer、Greenoaks 和紅杉資本領投,並獲得黑石、D.E. Shaw、DST Global 和富達等機構的重大承諾
。
這筆資金正式使 Anthropic 成為全球最有價值的 AI 新創公司,超越了 OpenAI 上次確認的 8520 億美元估值 。Anthropic 表示,這筆資金將用於擴大運算能力,以滿足企業對 Claude 日益增長的需求,並在全球範圍內擴展產品
。
將 Mythos 推向廣泛發布的決定並非沒有強烈的反對聲音。辯論的核心是「雙重用途」的難題:讓 Mythos 在尋找待修補漏洞方面表現卓越的推理能力,同樣也使其成為終極的攻擊工具包 。分析師警告,廣泛的存取權限可能武裝惡意行為者,讓其擁有一個能自主串聯多個漏洞利用、繞過作業系統沙箱和瀏覽器渲染器保護的工具
。
傳統的漏洞賞金和道德駭客模式,如今面臨一個存在主義的提問。如果單一模型就能自主發現數以千計的零日漏洞,那麼人類安全研究員的角色,將從發現轉變為分類和遏止 。Anthropic 的遏止策略——利用玻璃翼計畫將存取權限過濾給 50 家經審查的企業——同時引來了讚揚與批評。支持者認為,這在證明模型防禦價值的同時,防止了災難性的外洩;批評者則認為,將此類工具置於更廣泛的安全社群之外,拖慢了全球的修補流程
。
5 月 28 日的公告,標誌著一項實驗的結束與一個新階段的開始。Anthropic 賭的是,一個廣泛可用的 Mythos 級模型,其防禦性利益將超過攻擊性風險。而這個賭注,在它出貨的那一刻就將開始受到檢驗。
Comments
0 comments