Discover

答案已發布24 小時前Last edited 23 小時前39 來源

OpenAI GPT-5.6 三款新模型登場！Sol 冠絕 Terminal-Bench 2.1，但政府限制下只能部分用家率先試用

OpenAI 在 2026 年 6 月 26 日宣佈 GPT 5.6 系列：Sol（旗艦）、Terra（平衡實惠）及 Luna（平快），編號代表世代，名字代表能力級別 Sol 在 Terminal Bench 2.1 編程測試中以 91.9%（Ultra 模式）創下新紀錄，並超越 Anthropic 嘅 Claude Mythos 5 生物領域 GeneBench v1 方面，Sol 比 GPT 5.5 表現更好，仲要用少好多嘅 Token

使用 Studio Global AI 搜尋並查核事實瀏覽更多熱門頁面

62K0

Abstract digital illustration representing OpenAI's new GPT-5.6 model family with three celestial bodies (Sol, Terra, and Luna) and network connections — Search & fact-check with cited sources for What are the key details about OpenAI's preview of the GPT-5.6 family (Sol, Terra, and Luna), incConceptual illustration of OpenAI's GPT-5.6 family: Sol, Terra, and Luna
AI 提示
Create a landscape editorial hero image for this Studio Global article: Search & fact-check with cited sources for What are the key details about OpenAI's preview of the GPT-5.6 family (Sol, Terra, and Luna), inc. Article summary: Here is a verified, sourced summary of the key details about OpenAI's GPT-5.6 family preview, announced June 26, 2026.. Topic tags: general, general web, user generated. Style: premium digital editorial illustration, source-backed research mood, clean composition, high detail, modern web publication hero. Use reference image context only for broad subject, composition, and topical grounding; do not copy the exact image. Avoid: logos, brand marks, copyrighted characters, real person likenesses, fake screenshots, UI text, readable text, watermarks, charts with fake numbers, clickbait thumbnails, icons, and tiny thumbnail layouts. Make it useful as an illustrative
openai.com

OpenAI 喺 2026 年 6 月 26 日正式公佈咗 GPT-5.6 家族，一口氣推出三個新模型：Sol、Terra 同 Luna 。最引人注目的，除咗模型能力，仲有今次破天荒嘅發佈方式——OpenAI 應美國政府要求，初期只係俾少量獲批嘅夥伴試用。本文一次過同你拆解新命名系統、編程、生物同網絡安全嘅 Benchmark 分數、多層安全機制、定價、Prompt Caching 更新，以及漸進式發佈細節。

全新命名系統：世代號加能力級別

OpenAI 今次用咗全新嘅命名方法：「5.6」代表模型世代，而「Sol」、「Terra」、「Luna」就代表能力級別。呢個系統設計用意係更耐用：Sol、Terra、Luna 會各自按自己嘅步伐升級。三個級別嘅定位如下：

Sol：旗艦級，專為最難嘅推理任務、長期代理工作而設
Terra：平衡型，日常應用，效能可媲美 GPT-5.5，但成本大概平一半
Luna：最快最抵用，適合大量用家嘅高用量場景

Benchmark 成績：編程、生物、網絡安全全面睇

OpenAI 表示 GPT-5.6 Sol 喺編程、生物同網絡安全三大領域都達到新水平。

編程 — Terminal-Bench 2.1

Terminal-Bench 2.1 測試命令行工作流程，需要多步驟規劃、工具協調同反覆修改。Benchmark 包含 89 個複雜編程任務，結果如下：

模型	分數
GPT-5.6 Sol Ultra	91.9%
GPT-5.6 Sol（最高設定）	88.8%
Claude Mythos 5	88.0%
GPT-5.6 Terra	84.3%
Claude Fable 5	84.3%
GPT-5.5	83.4%
GPT-5.6 Luna	82.5%

GPT-5.6 Sol Ultra 以 91.9% 刷新咗業界最佳成績。普通 Sol 嘅 88.8% 得分，比 Anthropic 嘅受限制前沿模型 Claude Mythos 5（88.0%）高接近一個百分點。

生物學 — GeneBench v1

喺 GeneBench v1 上，呢個 Benchmark 評估長期基因組學同定量生物學分析任務。OpenAI 表示 Sol 嘅表現比 GPT-5.5 更好，而且用嘅輸出 Token 更少。對科研工作流程嚟講，呢個係一個好有意義嘅效率提升。

網絡安全 — ExploitBench 同 ExploitGym

喺 ExploitBench 呢個網絡安全研究 Benchmark 上，GPT-5.6 Sol 嘅表現幾乎追到 Anthropic 嘅 Mythos Preview，但所用嘅輸出 Token 大約只有佢嘅三分之一。

喺 ExploitGym 上——呢個係由 UC Berkeley 研究人員聯同 OpenAI 等前沿 AI 實驗室合作開發嘅 Benchmark——三個 GPT-5.6 模型都顯示出隨推理能力提升而有更強嘅網絡安全表現。

值得留意嘅係，OpenAI 明確指出 GPT-5.6 Sol 喺其預備框架下 並未跨越「Cyber Critical」門檻 。喺涉及 Chromium 同 Firefox 嘅評估中，模型雖然識得辨識漏洞同利用原語（即 exploit 嘅基本構件），但喺測試條件下 未能自主建立一個完整嘅功能 exploit 鏈 。整個 GPT-5.6 系列內部評級為「高」風險（網絡安全同生物武器能力方面），但並未去到最高嘅「嚴重」級別。

安全機制：OpenAI 話係「史上最強」

OpenAI 表示 GPT-5.6 Sol 推出時配備咗「佢哋史上最完備嘅安全機制」。安全方法包括：

強化即時防護：針對高風險網絡活動同重複不當使用
全新激活分類器：用於敏感領域，可以喺模型生成期間介入，阻止輸出唔安全嘅答案
人手紅隊測試及 超過 70 萬 A100 等效 GPU 小時嘅自動化測試：搵出越獄技巧，加固系統
組合訓練、實時監控、帳戶級別信號同分層存取控制嘅多層安全系統

喺預覽期間，某啲提示可能會被減慢或攔截，以便 OpenAI 進一步調整假陽性同假陰性率。

漸進式發佈及美國政府協調

GPT-5.6 嘅發佈方式同以往任何一次 OpenAI 發佈都唔同。應美國政府要求，OpenAI 初期只係將存取權限限制喺一小部分受信賴嘅合作夥伴同機構——Axios 報道預覽期間大約有 20 間獲批公司——而模型正進行額外嘅國家安全審查。

呢個預覽並唔係一個開放俾公眾自己申請嘅計劃。喺呢段期間，GPT-5.6 Sol、Terra 同 Luna 只係透過 OpenAI API 同 Codex 向呢批有限合作伙伴提供。模型 唔會喺預覽期間喺 ChatGPT 上使用 。OpenAI 表示計劃「未來幾星期」透過 ChatGPT、Codex 同 API 更廣泛地提供。

OpenAI 講到明，佢哋認為呢個政府把關嘅做法只係暫時措施：「我哋相信廣泛使用權，呢個過程唔應該成為長期常態」 。喺內部備忘錄中，CEO Sam Altman 向員工表示，政府會「喺預覽期間逐個客戶審批存取權」，希望大約兩星期後可以更廣泛發佈。

呢個決定係經過與國家網絡總監辦公室同科技政策辦公室協商後得出，反映咗特朗普政府正在測試嘅新前沿模型框架。

API 定價

OpenAI 官方幫助中心確認以下每百萬 Token 定價：

模型	輸入 / 每百萬 Token	輸出 / 每百萬 Token
GPT-5.6 Sol	$5.00	$30.00
GPT-5.6 Terra	$2.50	$15.00
GPT-5.6 Luna	$1.00	$6.00

Sol 嘅定價同 GPT-5.5 嘅定價相同，而 Terra 就大約係 GPT-5.5 嘅一半。相比之下，Sol 嘅定價比較接近 Claude Opus 4.8（$5/$25），而遠低於 Anthropic 嘅受限制模型 Mythos 5（$10/$50）。

Prompt Caching 更新

GPT-5.6 引入咗更可預測嘅 Prompt Caching，主要改進包括：

支援明確嘅緩存斷點：開發人員可以控制提示嘅邊啲部分應該被緩存
最少 30 分鐘嘅緩存壽命
緩存寫入按 模型未使用緩存時輸入費率嘅 1.25 倍 收費
緩存讀取繼續享有 90% 嘅緩存輸入折扣

Cerebras 部署

OpenAI 同時宣佈，GPT-5.6 Sol 將會喺 7 月部署到 Cerebras 硬件上，推論速度高達每秒 750 個 Token 。

重點總結

GPT-5.6 家族標誌住同以往 OpenAI 發佈截然不同嘅新方向。三個級別（Sol、Terra、Luna）嘅包裝方式引入咗更耐用嘅品牌，將模型世代同能力級別分開。Benchmark 結果——尤其係 Sol 喺 Terminal-Bench 2.1 上創紀錄嘅編程分數，以及喺 ExploitBench 上嘅效率提升——展示咗實質嘅進步，特別喺網絡安全同生物學方面。但今次發佈最具標誌性嘅特點，可能係政府要求嘅存取限制，呢個代表咗前沿 AI 部署嘅新常態。

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

使用 Studio Global AI 搜尋並查核事實

人們還問