Discover

答案已發布24 小時前Last edited 23 小時前39 個來源

OpenAI GPT-5.6 Sol、Terra、Luna 全解析：基準測試、定價、安全機制與政府監管式發佈

OpenAI 於 2026 年 6 月 26 日推出 GPT 5.6 系列，包含三款模型：旗艦級 Sol、平衡型 Terra 與高速低價 Luna。編碼方面，Sol Ultra 在 Terminal Bench 2.1 以 91.9% 創下新紀錄，超越 Anthropic Claude Mythos 5。

使用 Studio Global AI 搜尋並查證事實瀏覽更多熱門頁面

29K0

Abstract digital illustration representing OpenAI's new GPT-5.6 model family with three celestial bodies (Sol, Terra, and Luna) and network connections — Search & fact-check with cited sources for What are the key details about OpenAI's preview of the GPT-5.6 family (Sol, Terra, and Luna), incConceptual illustration of OpenAI's GPT-5.6 family: Sol, Terra, and Luna
AI 提示詞
Create a landscape editorial hero image for this Studio Global article: Search & fact-check with cited sources for What are the key details about OpenAI's preview of the GPT-5.6 family (Sol, Terra, and Luna), inc. Article summary: Here is a verified, sourced summary of the key details about OpenAI's GPT-5.6 family preview, announced June 26, 2026.. Topic tags: general, general web, user generated. Style: premium digital editorial illustration, source-backed research mood, clean composition, high detail, modern web publication hero. Use reference image context only for broad subject, composition, and topical grounding; do not copy the exact image. Avoid: logos, brand marks, copyrighted characters, real person likenesses, fake screenshots, UI text, readable text, watermarks, charts with fake numbers, clickbait thumbnails, icons, and tiny thumbnail layouts. Make it useful as an illustrative
openai.com

2026 年 6 月 26 日，OpenAI 正式發表 GPT-5.6 系列，一口氣推出 Sol、Terra、Luna 三款模型。這次發佈之所以備受關注，不僅因為模型的能力，更在於 OpenAI 破天荒與美國政府協調，實施了前所未有的發佈限制。本文將涵蓋所有關鍵細節：新的命名規則、編碼、生物學與網路安全三大領域的基準測試成績、多層安全架構、定價策略、提示快取更新，以及分階段發佈的方法。

全新命名系統：世代編號加能力等級

OpenAI 為這次發佈引入了全新的命名慣例。世代編號「5.6」代表模型系列，而 Sol、Terra、Luna 則代表能力等級。這個系統旨在保持耐用性：Sol、Terra、Luna 將會按照各自的節奏升級。三個等級分別為：

Sol：旗艦級模型，專為前沿推理、長週期自主任務以及最嚴苛的工作而設計。
Terra：平衡型日常模型，提供與 GPT-5.5 相當的效能，但成本約低 2 倍。
Luna：最快、最具成本效益的等級，專為高流量、低價格的工作而生。

基準測試表現：編碼、生物學與網路安全

OpenAI 將 GPT-5.6 Sol 定位為三大關鍵領域的新標竿：編碼、生物學和網路安全。

編碼 — Terminal-Bench 2.1

Terminal-Bench 2.1 測試的是需要在命令列進行多步驟規劃、工具協調與迭代的工作流程。該基準測試包含 89 個複雜的程式設計任務。結果如下：

模型	得分
GPT-5.6 Sol Ultra	91.9%
GPT-5.6 Sol (max)	88.8%
Claude Mythos 5	88.0%
GPT-5.6 Terra	84.3%
Claude Fable 5	84.3%
GPT-5.5	83.4%
GPT-5.6 Luna	82.5%

GPT-5.6 Sol Ultra 以 91.9% 的成績創下新的業界最佳記錄。標準 Sol 的 88.8% 分數，以將近一個百分點的差距，領先 Anthropic 受限的前沿模型 Claude Mythos 5 。

生物學 — GeneBench v1

在評量長週期基因組學與定量生物學分析任務的 GeneBench v1 上，OpenAI 報告指出，Sol 在比 GPT-5.5 使用更少輸出 token 的情況下，取得了更強大的結果。這對科學研究工作流程而言，是一項有意義的效率提升。

網路安全 — ExploitBench 與 ExploitGym

在網路安全研究基準 ExploitBench 上，GPT-5.6 Sol 的表現幾乎與 Anthropic 的 Mythos Preview 並駕齊驅，但僅使用了大約三分之一的輸出 token 。

在 ExploitGym 上，這個由加州大學柏克萊分校研究人員與 OpenAI 及其他前沿 AI 實驗室合作打造的基準測試中，所有三個 GPT-5.6 模型都顯示出隨著推理能力的提升，網路安全能力也隨之增強。

重要的是，OpenAI 表示，根據其「準備框架」，GPT-5.6 Sol 並未跨越「重大網路威脅 (Cyber Critical)」門檻 。在涉及 Chromium 和 Firefox 的評估中，該模型識別出了錯誤和利用基礎元件——也就是打造漏洞攻擊程式的積木——但在測試條件下，並未自主產出能實際運作的完整攻擊鏈 。整個 GPT-5.6 模型系列在內部被評定為「高」風險等級（針對網路安全和生物武器能力），但未達到最高的「重大 (Critical)」等級。

安全堆疊：OpenAI「迄今最穩健」

OpenAI 表示，GPT-5.6 Sol 搭載了其「迄今最穩健的安全堆疊」。安全措施包括：

強化即時防護，針對高風險網路活動與反覆濫用行為。
針對敏感領域新增的啟動分類器，能在生成過程中介入，阻止不安全的回答。
真人紅隊測試與超過 70 萬 A100 等效 GPU 小時的自動化測試，用以挖掘越獄技術並強化系統。
結合訓練、即時監控、帳戶層級信號以及分層存取控制的層層安全系統。

在預覽期間，部分提示詞可能會被減速或封鎖以進行額外審查，讓 OpenAI 微調假陽性和假陰性比率。

分階段發佈與美國政府協調

GPT-5.6 的推出方式與 OpenAI 以往的任何發佈都截然不同。應美國政府要求，OpenAI 初期僅將存取權限限於一小群受信賴的合作夥伴與組織——Axios 報導指出，預覽對象約有 20 家獲准公司——在此期間，模型將接受額外的國家安全審查。

這次預覽並非廣泛的自助式服務。在此期間，GPT-5.6 Sol、Terra、Luna 僅能透過 OpenAI API 和 Codex 提供給這個有限群體使用。預覽期間，這些模型不會在 ChatGPT 中提供。OpenAI 表示，更廣泛地在 ChatGPT、Codex 和 API 中提供的計畫，將在「未來幾週內」實現。

OpenAI 明確表示，它將這種政府監管方式視為一項臨時措施：「我們相信廣泛的存取權利，這個過程不應該成為長期的常態」 。在一份內部備忘錄中，執行長 Sam Altman 告訴員工，政府將會「在此預覽期間逐個客戶批准存取權限」，並希望能在幾週後進行更廣泛的發佈。

此舉源於 OpenAI 與「國家網路總監辦公室」及「科學與技術政策辦公室」的會談，反映了川普政府正在測試的一項新的前沿模型框架。

API 定價

OpenAI 官方幫助中心確認了以下每百萬 token 的定價：

模型	輸入 / 1M tokens	輸出 / 1M tokens
GPT-5.6 Sol	$5.00	$30.00
GPT-5.6 Terra	$2.50	$15.00
GPT-5.6 Luna	$1.00	$6.00

Sol 的定價與 GPT-5.5 相同，而 Terra 則比 GPT-5.5 便宜約 2 倍。脈絡上來說，Sol 的定價更接近 Claude Opus 4.8 ($5/$25)，而非 Anthropic 受限的 Mythos 5 ($10/$50) 。

提示快取更新

GPT-5.6 引入了更具可預測性的提示快取，並帶有幾項關鍵變更：

支援明確的快取中斷點，讓開發者可以控制提示詞的哪些部分被快取。
30 分鐘的最小快取生命週期 。
快取寫入將以模型未快取輸入率的 1.25 倍計費。
快取讀取仍可繼續享有 90% 的快取輸入折扣 。

Cerebras 部署

OpenAI 同時宣佈，GPT-5.6 Sol 將於 7 月部署在 Cerebras 硬體上，推論速度最高可達每秒 750 個 token 。

結論

GPT-5.6 系列的推出，標誌著 OpenAI 的重大轉變。其三層級的包裝方式（Sol, Terra, Luna）引入了耐用的品牌識別，將模型系列與能力等級脫鉤。基準測試結果——尤其是 Sol 在 Terminal-Bench 2.1 上創紀錄的編碼分數，以及在 ExploitBench 上的效率提升——展現了實質的進步，特別是在網路安全和生物學領域。但這次發佈最具決定性的特點，或許是政府要求實施的存取限制，這代表著前沿 AI 部署的新模式。

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

使用 Studio Global AI 搜尋並查證事實

大家也會問