OpenAI 在 2026 年 6 月 26 日宣佈 GPT 5.6 系列:Sol(旗艦)、Terra(平衡實惠)及 Luna(平快),編號代表世代,名字代表能力級別 Sol 在 Terminal Bench 2.1 編程測試中以 91.9%(Ultra 模式)創下新紀錄,並超越 Anthropic 嘅 Claude Mythos 5 生物領域 GeneBench v1 方面,Sol 比 GPT 5.5 表現更好,仲要用少好多嘅 Token

Create a landscape editorial hero image for this Studio Global article: Search & fact-check with cited sources for What are the key details about OpenAI's preview of the GPT-5.6 family (Sol, Terra, and Luna), inc. Article summary: Here is a verified, sourced summary of the key details about OpenAI's GPT-5.6 family preview, announced June 26, 2026.. Topic tags: general, general web, user generated. Style: premium digital editorial illustration, source-backed research mood, clean composition, high detail, modern web publication hero. Use reference image context only for broad subject, composition, and topical grounding; do not copy the exact image. Avoid: logos, brand marks, copyrighted characters, real person likenesses, fake screenshots, UI text, readable text, watermarks, charts with fake numbers, clickbait thumbnails, icons, and tiny thumbnail layouts. Make it useful as an illustrative
OpenAI 喺 2026 年 6 月 26 日正式公佈咗 GPT-5.6 家族,一口氣推出三個新模型:Sol、Terra 同 Luna 。最引人注目的,除咗模型能力,仲有今次破天荒嘅發佈方式——OpenAI 應美國政府要求,初期只係俾少量獲批嘅夥伴試用。本文一次過同你拆解新命名系統、編程、生物同網絡安全嘅 Benchmark 分數、多層安全機制、定價、Prompt Caching 更新,以及漸進式發佈細節。
OpenAI 今次用咗全新嘅命名方法:「5.6」代表模型世代,而「Sol」、「Terra」、「Luna」就代表能力級別 。呢個系統設計用意係更耐用:Sol、Terra、Luna 會各自按自己嘅步伐升級。三個級別嘅定位如下:
OpenAI 表示 GPT-5.6 Sol 喺編程、生物同網絡安全三大領域都達到新水平 。
Terminal-Bench 2.1 測試命令行工作流程,需要多步驟規劃、工具協調同反覆修改 。Benchmark 包含 89 個複雜編程任務
,結果如下:
| 模型 | 分數 |
|---|---|
| GPT-5.6 Sol Ultra | 91.9% |
| GPT-5.6 Sol(最高設定) | 88.8% |
| Claude Mythos 5 | 88.0% |
| GPT-5.6 Terra | 84.3% |
| Claude Fable 5 | 84.3% |
| GPT-5.5 | 83.4% |
| GPT-5.6 Luna | 82.5% |
GPT-5.6 Sol Ultra 以 91.9% 刷新咗業界最佳成績 。普通 Sol 嘅 88.8% 得分,比 Anthropic 嘅受限制前沿模型 Claude Mythos 5(88.0%)高接近一個百分點
。
喺 GeneBench v1 上,呢個 Benchmark 評估長期基因組學同定量生物學分析任務。OpenAI 表示 Sol 嘅表現比 GPT-5.5 更好,而且用嘅輸出 Token 更少 。對科研工作流程嚟講,呢個係一個好有意義嘅效率提升。
喺 ExploitBench 呢個網絡安全研究 Benchmark 上,GPT-5.6 Sol 嘅表現幾乎追到 Anthropic 嘅 Mythos Preview,但所用嘅輸出 Token 大約只有佢嘅三分之一 。
喺 ExploitGym 上——呢個係由 UC Berkeley 研究人員聯同 OpenAI 等前沿 AI 實驗室合作開發嘅 Benchmark——三個 GPT-5.6 模型都顯示出隨推理能力提升而有更強嘅網絡安全表現 。
值得留意嘅係,OpenAI 明確指出 GPT-5.6 Sol 喺其預備框架下 並未跨越「Cyber Critical」門檻 。喺涉及 Chromium 同 Firefox 嘅評估中,模型雖然識得辨識漏洞同利用原語(即 exploit 嘅基本構件),但喺測試條件下 未能自主建立一個完整嘅功能 exploit 鏈
。整個 GPT-5.6 系列內部評級為「高」風險(網絡安全同生物武器能力方面),但並未去到最高嘅「嚴重」級別
。
OpenAI 表示 GPT-5.6 Sol 推出時配備咗「佢哋史上最完備嘅安全機制」。安全方法包括:
喺預覽期間,某啲提示可能會被減慢或攔截,以便 OpenAI 進一步調整假陽性同假陰性率 。
GPT-5.6 嘅發佈方式同以往任何一次 OpenAI 發佈都唔同。應美國政府要求,OpenAI 初期只係將存取權限限制喺一小部分受信賴嘅合作夥伴同機構——Axios 報道預覽期間大約有 20 間獲批公司——而模型正進行額外嘅國家安全審查 。
呢個預覽並唔係一個開放俾公眾自己申請嘅計劃。喺呢段期間,GPT-5.6 Sol、Terra 同 Luna 只係透過 OpenAI API 同 Codex 向呢批有限合作伙伴提供 。模型 唔會喺預覽期間喺 ChatGPT 上使用
。OpenAI 表示計劃「未來幾星期」透過 ChatGPT、Codex 同 API 更廣泛地提供
。
OpenAI 講到明,佢哋認為呢個政府把關嘅做法只係暫時措施:「我哋相信廣泛使用權,呢個過程唔應該成為長期常態」 。喺內部備忘錄中,CEO Sam Altman 向員工表示,政府會「喺預覽期間逐個客戶審批存取權」,希望大約兩星期後可以更廣泛發佈
。
呢個決定係經過與國家網絡總監辦公室同科技政策辦公室協商後得出 ,反映咗特朗普政府正在測試嘅新前沿模型框架
。
OpenAI 官方幫助中心確認以下每百萬 Token 定價 :
| 模型 | 輸入 / 每百萬 Token | 輸出 / 每百萬 Token |
|---|---|---|
| GPT-5.6 Sol | $5.00 | $30.00 |
| GPT-5.6 Terra | $2.50 | $15.00 |
| GPT-5.6 Luna | $1.00 | $6.00 |
Sol 嘅定價同 GPT-5.5 嘅定價相同,而 Terra 就大約係 GPT-5.5 嘅一半 。相比之下,Sol 嘅定價比較接近 Claude Opus 4.8($5/$25),而遠低於 Anthropic 嘅受限制模型 Mythos 5($10/$50)
。
GPT-5.6 引入咗更可預測嘅 Prompt Caching,主要改進包括 :
OpenAI 同時宣佈,GPT-5.6 Sol 將會喺 7 月部署到 Cerebras 硬件上 ,推論速度高達每秒 750 個 Token
。
GPT-5.6 家族標誌住同以往 OpenAI 發佈截然不同嘅新方向。三個級別(Sol、Terra、Luna)嘅包裝方式引入咗更耐用嘅品牌,將模型世代同能力級別分開。Benchmark 結果——尤其係 Sol 喺 Terminal-Bench 2.1 上創紀錄嘅編程分數,以及喺 ExploitBench 上嘅效率提升——展示咗實質嘅進步,特別喺網絡安全同生物學方面。但今次發佈最具標誌性嘅特點,可能係政府要求嘅存取限制,呢個代表咗前沿 AI 部署嘅新常態。
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
OpenAI 在 2026 年 6 月 26 日宣佈 GPT 5.6 系列:Sol(旗艦)、Terra(平衡實惠)及 Luna(平快),編號代表世代,名字代表能力級別
OpenAI 在 2026 年 6 月 26 日宣佈 GPT 5.6 系列:Sol(旗艦)、Terra(平衡實惠)及 Luna(平快),編號代表世代,名字代表能力級別 Sol 在 Terminal Bench 2.1 編程測試中以 91.9%(Ultra 模式)創下新紀錄,並超越 Anthropic 嘅 Claude Mythos 5
生物領域 GeneBench v1 方面,Sol 比 GPT 5.5 表現更好,仲要用少好多嘅 Token
Loading comments...
Comments
0 comments