OpenAI 於 2026 年 6 月 26 日推出 GPT 5.6 系列,包含三款模型:旗艦級 Sol、平衡型 Terra 與高速低價 Luna。 編碼方面,Sol Ultra 在 Terminal Bench 2.1 以 91.9% 創下新紀錄,超越 Anthropic Claude Mythos 5。

Create a landscape editorial hero image for this Studio Global article: Search & fact-check with cited sources for What are the key details about OpenAI's preview of the GPT-5.6 family (Sol, Terra, and Luna), inc. Article summary: Here is a verified, sourced summary of the key details about OpenAI's GPT-5.6 family preview, announced June 26, 2026.. Topic tags: general, general web, user generated. Style: premium digital editorial illustration, source-backed research mood, clean composition, high detail, modern web publication hero. Use reference image context only for broad subject, composition, and topical grounding; do not copy the exact image. Avoid: logos, brand marks, copyrighted characters, real person likenesses, fake screenshots, UI text, readable text, watermarks, charts with fake numbers, clickbait thumbnails, icons, and tiny thumbnail layouts. Make it useful as an illustrative
2026 年 6 月 26 日,OpenAI 正式發表 GPT-5.6 系列,一口氣推出 Sol、Terra、Luna 三款模型 。這次發佈之所以備受關注,不僅因為模型的能力,更在於 OpenAI 破天荒與美國政府協調,實施了前所未有的發佈限制。本文將涵蓋所有關鍵細節:新的命名規則、編碼、生物學與網路安全三大領域的基準測試成績、多層安全架構、定價策略、提示快取更新,以及分階段發佈的方法。
OpenAI 為這次發佈引入了全新的命名慣例。世代編號「5.6」代表模型系列,而 Sol、Terra、Luna 則代表能力等級 。這個系統旨在保持耐用性:Sol、Terra、Luna 將會按照各自的節奏升級。三個等級分別為:
OpenAI 將 GPT-5.6 Sol 定位為三大關鍵領域的新標竿:編碼、生物學和網路安全 。
Terminal-Bench 2.1 測試的是需要在命令列進行多步驟規劃、工具協調與迭代的工作流程 。該基準測試包含 89 個複雜的程式設計任務
。結果如下:
| 模型 | 得分 |
|---|---|
| GPT-5.6 Sol Ultra | 91.9% |
| GPT-5.6 Sol (max) | 88.8% |
| Claude Mythos 5 | 88.0% |
| GPT-5.6 Terra | 84.3% |
| Claude Fable 5 | 84.3% |
| GPT-5.5 | 83.4% |
| GPT-5.6 Luna | 82.5% |
GPT-5.6 Sol Ultra 以 91.9% 的成績創下新的業界最佳記錄 。標準 Sol 的 88.8% 分數,以將近一個百分點的差距,領先 Anthropic 受限的前沿模型 Claude Mythos 5
。
在評量長週期基因組學與定量生物學分析任務的 GeneBench v1 上,OpenAI 報告指出,Sol 在比 GPT-5.5 使用更少輸出 token 的情況下,取得了更強大的結果 。這對科學研究工作流程而言,是一項有意義的效率提升。
在網路安全研究基準 ExploitBench 上,GPT-5.6 Sol 的表現幾乎與 Anthropic 的 Mythos Preview 並駕齊驅,但僅使用了大約三分之一的輸出 token 。
在 ExploitGym 上,這個由加州大學柏克萊分校研究人員與 OpenAI 及其他前沿 AI 實驗室合作打造的基準測試中,所有三個 GPT-5.6 模型都顯示出隨著推理能力的提升,網路安全能力也隨之增強 。
重要的是,OpenAI 表示,根據其「準備框架」,GPT-5.6 Sol 並未跨越「重大網路威脅 (Cyber Critical)」門檻 。在涉及 Chromium 和 Firefox 的評估中,該模型識別出了錯誤和利用基礎元件——也就是打造漏洞攻擊程式的積木——但在測試條件下,並未自主產出能實際運作的完整攻擊鏈
。整個 GPT-5.6 模型系列在內部被評定為「高」風險等級(針對網路安全和生物武器能力),但未達到最高的「重大 (Critical)」等級
。
OpenAI 表示,GPT-5.6 Sol 搭載了其「迄今最穩健的安全堆疊」。安全措施包括:
在預覽期間,部分提示詞可能會被減速或封鎖以進行額外審查,讓 OpenAI 微調假陽性和假陰性比率 。
GPT-5.6 的推出方式與 OpenAI 以往的任何發佈都截然不同。應美國政府要求,OpenAI 初期僅將存取權限限於一小群受信賴的合作夥伴與組織——Axios 報導指出,預覽對象約有 20 家獲准公司——在此期間,模型將接受額外的國家安全審查 。
這次預覽並非廣泛的自助式服務。在此期間,GPT-5.6 Sol、Terra、Luna 僅能透過 OpenAI API 和 Codex 提供給這個有限群體使用 。預覽期間,這些模型不會在 ChatGPT 中提供
。OpenAI 表示,更廣泛地在 ChatGPT、Codex 和 API 中提供的計畫,將在「未來幾週內」實現
。
OpenAI 明確表示,它將這種政府監管方式視為一項臨時措施:「我們相信廣泛的存取權利,這個過程不應該成為長期的常態」 。在一份內部備忘錄中,執行長 Sam Altman 告訴員工,政府將會「在此預覽期間逐個客戶批准存取權限」,並希望能在幾週後進行更廣泛的發佈
。
此舉源於 OpenAI 與「國家網路總監辦公室」及「科學與技術政策辦公室」的會談 ,反映了川普政府正在測試的一項新的前沿模型框架
。
OpenAI 官方幫助中心確認了以下每百萬 token 的定價 :
| 模型 | 輸入 / 1M tokens | 輸出 / 1M tokens |
|---|---|---|
| GPT-5.6 Sol | $5.00 | $30.00 |
| GPT-5.6 Terra | $2.50 | $15.00 |
| GPT-5.6 Luna | $1.00 | $6.00 |
Sol 的定價與 GPT-5.5 相同,而 Terra 則比 GPT-5.5 便宜約 2 倍 。脈絡上來說,Sol 的定價更接近 Claude Opus 4.8 ($5/$25),而非 Anthropic 受限的 Mythos 5 ($10/$50)
。
GPT-5.6 引入了更具可預測性的提示快取,並帶有幾項關鍵變更 :
OpenAI 同時宣佈,GPT-5.6 Sol 將於 7 月部署在 Cerebras 硬體上 ,推論速度最高可達每秒 750 個 token
。
GPT-5.6 系列的推出,標誌著 OpenAI 的重大轉變。其三層級的包裝方式(Sol, Terra, Luna)引入了耐用的品牌識別,將模型系列與能力等級脫鉤。基準測試結果——尤其是 Sol 在 Terminal-Bench 2.1 上創紀錄的編碼分數,以及在 ExploitBench 上的效率提升——展現了實質的進步,特別是在網路安全和生物學領域。但這次發佈最具決定性的特點,或許是政府要求實施的存取限制,這代表著前沿 AI 部署的新模式。
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
OpenAI 於 2026 年 6 月 26 日推出 GPT 5.6 系列,包含三款模型:旗艦級 Sol、平衡型 Terra 與高速低價 Luna。
OpenAI 於 2026 年 6 月 26 日推出 GPT 5.6 系列,包含三款模型:旗艦級 Sol、平衡型 Terra 與高速低價 Luna。 編碼方面,Sol Ultra 在 Terminal Bench 2.1 以 91.9% 創下新紀錄,超越 Anthropic Claude Mythos 5。
生物學方面,Sol 在 GeneBench v1 表現優於 GPT 5.5,且使用更少 token。
Loading comments...
Comments
0 comments