最可核實的結論:Spud 有具名媒體報道指是 OpenAI 正準備的模型,The Decoder 轉述稱已完成 pretraining;但本次可查 OpenAI API Models 只列出 gpt 5.4 系列,未見 GPT 5.5/Spud,所以 benchmark、demo 同發布日期仍未算已驗證。[23][26][21] 常見的 77.80% vs 57.70% 是 Holter 文中 Claude Mythos Preview 與 GPT 5.4 的 SWE bench Pro 比較,不是 Spud 的公開原始分數;本次 SWE bench 來源亦未提供 Spud entry。[3][30] 3D、SVG、網站與遊戲...

Create a landscape editorial hero image for this Studio Global article: GPT-5.5「Spud」事實核查:benchmark、demo、release leak 有幾多可信?. Article summary: 最可核實的結論係:Spud 可能是 OpenAI 內部模型代號,且有媒體轉述稱已完成 pretraining;但本次可查 OpenAI API model list 未列出 GPT 5.5/Spud,提供材料亦未有 model card 或 system card。[23][26][21]. Topic tags: ai, openai, chatgpt, llm, ai benchmarks. Reference image context from search candidates: Reference image 1: visual subject "Spud 是一個能媲美Claude Mythos 的模型,應該也是一個超大的模型,可能10 兆參數左右. 個人不覺得它會叫GPT-5.5,應該會是GPT-6 才合理. 135." source context "OpenAI推出代號「Spud」的GPT‑5.5 面向企業的更強AI模型加速登場" Reference image 2: visual subject "A detailed infographic summarizes updates and improvements in GPT-5.5, highlighting features such as stronger reasoning, long-context handling, faster performance, and cost changes" Style: premium digital editorial illustration, source-backed research mood, clean composition, high detail, m
網上關於 GPT-5.5「Spud」的說法很多,但真正能夠獨立核實的部分很窄。較穩陣的結論是:有媒體報道 OpenAI 正準備一個代號「Spud」的模型,The Decoder 亦轉述稱這個模型已完成 pretraining;但這仍然不是 OpenAI 官方發布、API entry、model card、system card,亦不是可重現 benchmark。[23][
26][
21]
以本次可查資料計,Spud 最強的證據來自媒體報道鏈,而不是社交截圖、YouTube 標題或 demo 圖。The Information 有一篇題為《OpenAI CEO Shifts Responsibilities, Preps ‘Spud’ AI Model》的報道;The Decoder 其後轉述稱,OpenAI reportedly finished pretraining 一個代號為 Spud 的新 AI model,消息來自 Sam Altman 對員工的內部 memo。[23][
26]
這足以令「Spud 是 OpenAI 內部模型代號」成為值得追蹤的說法,但仍未等於公開產品。OpenAI API Models 來源在本次材料中列出的是 gpt-5.4、、,未能確認 Spud 或 GPT-5.5 已公開可用。
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
最可核實的結論:Spud 有具名媒體報道指是 OpenAI 正準備的模型,The Decoder 轉述稱已完成 pretraining;但本次可查 OpenAI API Models 只列出 gpt 5.4 系列,未見 GPT 5.5/Spud,所以 benchmark、demo 同發布日期仍未算已驗證。[23][26][21]
最可核實的結論:Spud 有具名媒體報道指是 OpenAI 正準備的模型,The Decoder 轉述稱已完成 pretraining;但本次可查 OpenAI API Models 只列出 gpt 5.4 系列,未見 GPT 5.5/Spud,所以 benchmark、demo 同發布日期仍未算已驗證。[23][26][21] 常見的 77.80% vs 57.70% 是 Holter 文中 Claude Mythos Preview 與 GPT 5.4 的 SWE bench Pro 比較,不是 Spud 的公開原始分數;本次 SWE bench 來源亦未提供 Spud entry。[3][30]
3D、SVG、網站與遊戲 demo 目前多屬二手轉述;Geeky Gadgets 明言資料來自 Universe of AI,並寫到官方 performance metrics 仍未公開。[4]
繼續“香港警政考試溫習:ICAC、警權同問責三大考點”以獲得另一個角度和額外的引用。
Open related page對照「Claude Opus 4.7、GPT-5.5、DeepSeek V4、Kimi K2.6:2026 Benchmark 點睇先唔會睇錯」交叉檢查此答案。
Open related pageGPT-5.5 Spud: Everything About OpenAI Next Frontier Model. GPT-5.5 Spud is OpenAI next frontier model: pretraining complete, Q2 2026 release expected. GPT-5.5 , code-named "Spud" , is the next frontier model from OpenAI. GPT-5.5 Spud OpenAI next AI model le...
OpenAI Spud: Leaked April 16 Release, Mythos-Level Benchmarks, and What GPT-5.5 or GPT-6 Might Mean. Claude Mythos Preview posted 77.80% on SWE-bench Pro. GPT-5.4 is at 57.70%. OpenAI has been signaling that Spud, their next model, closes that gap. Before M...
According to Universe of AI, Spud demonstrates remarkable proficiency in areas such as 3D simulations and web development, with early tests showcasing its ability to create detailed interactive environments and professional-grade website designs. Dive into...
It's about enabling more natural and flexible creative expression for legitimate writing and storytelling. What this would allow: - Non- ... Mar 28, 2026
gpt-5.4-minigpt-5.4-nano換句話說,較準確的寫法是:Spud 是一個被媒體報道的 OpenAI 內部模型代號;它的公開名稱、能力分數、發布時間與 API 可用性,仍未有官方文件或可重現 benchmark 證實。[23][
26][
21]
核查模型傳聞時,最重要不是有多少人轉發,而是證據能否追溯。較嚴格的標準包括:
| 網傳 claim | 目前可核實到甚麼 | 判定 |
|---|---|---|
| OpenAI 有一個代號「Spud」的新模型 | The Information 題名直接提到 OpenAI 正準備「Spud」AI model;The Decoder 轉述稱 OpenAI reportedly finished pretraining a new AI model codenamed Spud。[ | 部分交叉印證,但未官方確認 |
| Spud 已公開,或將以 GPT-5.5 名義推出 | 本次 OpenAI API Models 來源列出 gpt-5.4 系列,未能確認 Spud/GPT-5.5 已公開。[ | 未驗證 |
| Spud benchmark 追近或超越 Claude Mythos | Holter 文中的 77.80% 是 Claude Mythos Preview 在 SWE-bench Pro 的數字,57.70% 是 GPT-5.4;對 Spud 的描述是 expectation 語氣,不是 Spud 原始分數。[ | 未驗證 |
| SWE-bench 已有 Spud 成績 | SWE-bench 有公開 leaderboard,但本次來源材料未提供可直接對應 Spud 的提交、結果頁或 eval card。[ | 未驗證 |
| 3D worlds、SVG、網站設計、互動遊戲 demo 證明 Spud 能力 | Geeky Gadgets 寫明是「According to Universe of AI」的轉述,並提到 official performance metrics remain undisclosed。[ | 二手轉述,不能當能力證明 |
| April 16、Q2 2026、一定叫 GPT-5.5 | 有文章將 Spud 寫成 GPT-5.5 並預期 Q2/April–May 2026;Holter 標題亦使用「Leaked April 16 Release」與「GPT-5.5 or GPT-6 Might Mean」這類未定語氣。[ | 偏 rumor,未驗證 |
| OpenAI Developer Community 出現「SPUD Release」字眼 | 相關頁面標題是「Please Add an Optional Expression Mode with the SPUD Release」,語境是 feature request,不是 release note、API 文件或 model card。[ | 不能當官方確認 |
Spud 傳聞中最容易被放大的部分,是 benchmark。Holter 文章提到 Claude Mythos Preview 在 SWE-bench Pro 為 77.80%,GPT-5.4 為 57.70%;但文章對 Spud 的關鍵描述是「the expectation is that Spud closes most or all of that gap」這類推測語氣。[3]
所以,這些數字最多只能支持「有人用其他模型分數推測 Spud 可能追上」;它們不能支持「Spud 已有獨立驗證 benchmark 分數」。如果要把 Spud benchmark 當成可信事實,至少需要見到以下其中一種證據:官方 benchmark 報告、model card、system card、公開 leaderboard entry、eval card、run log、prompt set、submission,或第三方可重現測試。
SWE-bench 本身有公開 leaderboard,是核對 coding benchmark claim 的基礎來源;但本次來源材料沒有提供任何可核實的 Spud leaderboard entry。[30]
流傳的 Spud demo 包括 3D simulations、interactive environments、website designs、SVG designs、interactive games 等。問題不是這些 demo 一定假,而是它們暫時未能證明「由 Spud 生成」和「可以重現」。Geeky Gadgets 的相關報道明確寫成「According to Universe of AI」的轉述,並提到官方 performance metrics 仍未公開。[4]
因此,這些 demo 目前較適合分類為「網傳輸出」或「二手展示」,而不是已驗證產品能力。若要升級為可引用證據,至少需要原始影片來源、完整 prompt、生成過程、模型名稱、時間戳、可重現步驟,或者 OpenAI 官方 demo page。
「Spud 會叫 GPT-5.5」和「某日發布」是最吸睛、亦最容易被放大的部分。有文章已直接將 Spud 包裝成 GPT-5.5,並寫出 Q2 或 April–May 2026 的預期;另一邊,Holter 文章標題使用「Leaked April 16 Release」和「GPT-5.5 or GPT-6 Might Mean」這類仍然不確定的寫法。[1][
3]
從事實核查角度看,這些都未達到官方發布門檻。除非 OpenAI 在 model docs、API、release notes 或官方 blog 裡列出正式名稱與可用性,否則「GPT-5.5」只能視為外界命名或推測,而不是已確認產品名。本次可查 OpenAI API Models 來源未能確認 Spud/GPT-5.5 已公開。[21]
OpenAI Developer Community 上出現「SPUD Release」字眼,容易被截圖包裝成官方暗示。但本次提供的相關頁面標題是「Please Add an Optional Expression Mode with the SPUD Release」,語境是用戶 feature request,而不是 OpenAI release note、API 文件或 model card。[13]
Forum mention 可以證明社群有人在討論 Spud;它不能證明 OpenAI 已確認 Spud 發布。
如果你要為 coding workflow、AI agent、產品 roadmap 或採購決策評估模型,暫時不應把 Spud benchmark 當成已知事實。較穩陣的做法是:
Spud 可能真有其事,因為有具名媒體報道 OpenAI 正準備一個代號 Spud 的模型,亦有報道轉述稱它已完成 pretraining。[23][
26] 但可發布、可依賴的結論要窄得多:目前不能把網傳 benchmark、3D demo、發布日期或 GPT-5.5 命名當成已獨立驗證事實。[
3][
4][
21][
30]
Start with gpt-5.4 for complex reasoning and coding, or choose gpt-5.4-mini and gpt-5.4-nano for lower-latency, lower-cost workloads. View all. Compare models.
OpenAI CEO Sam Altman has relinquished direct oversight of the company's safety and security teams so he can focus on raising capital, ... Mar 24, 2026
OpenAI has reportedly finished pretraining its new AI model, codenamed "Spud," CEO Sam Altman told employees in an internal memo, according ... Mar 25, 2026
- [x] 🆕 Gemini 3 Flash (high reasoning) 75.80 $0.36 []( 2026-02-17 2.0.0 . - [x] 🆕 GPT-5-2 Codex 72.80 $0.45 []( 2026-02-19 [2.0.0](