有幾個改進特別突出。喺能力方面,Opus 4.8 喺自主編碼、多學科知識工作,同自主電腦操作方面都交出更好嘅成績 。Claude Code 入面一個新嘅 「動態工作流程」(Dynamic Workflows) 功能,容許模型為橫跨數十萬行程式碼嘅代碼庫級別遷移,協調數百個並行嘅子代理
。用戶仲可以設置唔同嘅 「努力水平」(effort levels)——高(high)、超高(xhigh)同最大(max)——以及一個以 2.5 倍速度運行、比之前快 mode 平三倍嘅快速模式
。
可靠性方面亦有好大升級。Opus 4.8 經過訓練,可以更有效咁標記出自己工作入面嘅不確定性。佢比起前代,放過自己代碼中嘅錯誤而唔標記嘅可能性,大約低咗四倍,解決咗一個常見嘅痛點:高級模型好有信心咁交出有問題嘅輸出 。Anthropic 將呢個形容為軟件工程領域,模型誠實度嘅一次突破
。
好關鍵嘅一點係,雖然 Opus 4.8 係一個更強嘅自主代理,但佢同成個 Claude Opus 4 家族一樣,係建立喺同樣嘅 ASL-3(AI 安全級別 3) 部署同安全標準之上。呢啲協議包括嚴格嘅防護措施,會自動阻止顯示為禁止或高風險網絡安全用途嘅請求,以及強大嘅安全控制,去保護模型權重免遭成熟嘅非國家行為者盜竊 。
Claude Mythos Preview 嘅故事,先真正將呢個發布日同例行嘅模型更新區分開。喺 2026 年 4 月,Anthropic 披露咗呢個模型嘅存在,但明確拒絕公開發布。核心問題在於:Mythos Preview 展示咗喺所有主要作業系統同網頁瀏覽器上,自主發現同利用零日漏洞嘅能力 。英國 AI 安全研究所(AISI)確認,Mythos Preview 解決咗 73% 嘅專家級奪旗(CTF)網絡安全挑戰——呢個驚人成績將之前嘅模型遠遠拋離
。
為咗降低明顯嘅風險,Anthropic 創建咗 「Project Glasswing」,一個受控計劃,有大約 50 個合作夥伴組織——包括 AWS、Apple、Google、Microsoft、CrowdStrike 同摩根大通——佢哋只可以將 Mythos Preview 用於防禦性漏洞發現 。結果係歷史性嘅。合作夥伴喺全球最重要嘅軟件入面,發現咗超過 10,000 個高或嚴重級別嘅漏洞,大多數組織喺參與嘅第一個月內,各自都發現咗數百個呢類漏洞
。喺呢啲發現入面,有 6,202 個被歸類為新穎、此前未知嘅零日漏洞
。呢啲發現橫跨關鍵基礎設施,仲包埋一啲深藏嘅漏洞,例如喺 OpenBSD——其中一個最注重安全防護嘅作業系統——入面一個潛伏咗 27 年嘅漏洞
。
喺 5 月 28 日,Anthropic 宣布呢個實驗成功,並表示正準備喺未來幾星期內,將 Mythos 級模型作為「全新級別模型」發布畀所有客戶 。Glasswing 嘅結果提供咗證據,證明只要有適當嘅防護欄,呢啲模型係可以安全咁用於防禦性網絡工作。行業分析師報告指出,Claude Mythos 1 預期會喺 2026 年 6 月推出,同 Gemini 3.5 Pro 同 Grok 5 等其他主要模型一齊發布
。
產品發布伴隨住金融市場嘅震盪。同一日,Anthropic 宣布完成咗 650 億美元嘅 H 輪融資,投後估值達到 9650 億美元,比起 2 月份嘅 3800 億美元估值翻咗超過一倍 。呢輪融資由 Altimeter Capital、Dragoneer、Greenoaks 同紅杉資本(Sequoia Capital)領投,並得到 Blackstone、D.E. Shaw、DST Global 同 Fidelity 等機構嘅重大承諾
。
呢筆資金正式令 Anthropic 成為全球最高估值嘅 AI 初創公司,超越咗 OpenAI 上一次確認嘅 8520 億美元估值 。Anthropic 表示,呢筆資金將會用喺擴大計算能力,以滿足企業對 Claude 日益增長嘅需求,並將產品擴展到全球
。
將 Mythos 推向廣泛發布嘅決定並非無人反對。爭論嘅核心係「雙重用途」嘅困境:令 Mythos 喺尋找漏洞嚟修補方面咁出色嘅推理能力,同時亦令佢成為終極嘅攻擊工具 。分析師警告,廣泛開放存取權限,可能會使惡意行為者獲得一個能夠自主組合多個漏洞,去繞過作業系統沙箱同瀏覽器渲染器保護嘅工具
。
傳統嘅漏洞賞金同道德黑客模式,而家面臨一個存在性嘅問題。如果單一模型可以自主發現數千個零日漏洞,咁人類安全研究員嘅角色,就會由發現轉為分類同遏制 。Anthropic 嘅遏制策略——利用 Project Glasswing 將存取權限過濾畀 50 間經過審查嘅企業——引起咗讚賞同批評。支持者認為,呢個做法喺證明模型防禦價值嘅同時,防止咗災難性嘅洩漏;批評者就認為,將呢種工具同更廣泛嘅安全社群隔絕,會拖慢全球嘅修補進程
。
5 月 28 日嘅公告標誌住一個實驗嘅結束,同一個新階段嘅開始。Anthropic 押注喺廣泛可用嘅 Mythos 級模型,其防禦性好處會大過攻擊性風險,呢場賭博喺模型一出貨就會受到考驗。
Comments
0 comments