← Back to Trending

報告已發布3 個月前Last edited 2 個月前18 來源

GPT-5.5「Spud」事實核查：benchmark、demo 同發布傳聞有幾可信？

最可核實的結論：Spud 有具名媒體報道指是 OpenAI 正準備的模型，The Decoder 轉述稱已完成 pretraining；但本次可查 OpenAI API Models 只列出 gpt 5.4 系列，未見 GPT 5.5／Spud，所以 benchmark、demo 同發布日期仍未算已驗證。[23][26][21] 常見的 77.80% vs 57.70% 是 Holter 文中 Claude Mythos Preview 與 GPT 5.4 的 SWE bench Pro 比較，不是 Spud 的公開原始分數；本次 SWE bench 來源亦未提供 Spud entry。[3][30] 3D、SVG、網站與遊戲...

使用 Studio Global AI 搜尋並查核事實瀏覽更多熱門頁面

GPT-5.5「Spud」傳聞事實核查的抽象 AI 編輯室畫面 — GPT-5.5「Spud」事實核查：benchmark、demo、release leak 有幾多可信？AI-generated editorial illustration for a fact-check on GPT-5.5「Spud」benchmark、demo 與 release leak 傳聞。
AI 提示
Create a landscape editorial hero image for this Studio Global article: GPT-5.5「Spud」事實核查：benchmark、demo、release leak 有幾多可信？. Article summary: 最可核實的結論係：Spud 可能是 OpenAI 內部模型代號，且有媒體轉述稱已完成 pretraining；但本次可查 OpenAI API model list 未列出 GPT 5.5／Spud，提供材料亦未有 model card 或 system card。[23][26][21]. Topic tags: ai, openai, chatgpt, llm, ai benchmarks. Reference image context from search candidates: Reference image 1: visual subject "Spud 是一個能媲美Claude Mythos 的模型，應該也是一個超大的模型，可能10 兆參數左右. 個人不覺得它會叫GPT-5.5，應該會是GPT-6 才合理. 135." source context "OpenAI推出代號「Spud」的GPT‑5.5 面向企業的更強AI模型加速登場" Reference image 2: visual subject "A detailed infographic summarizes updates and improvements in GPT-5.5, highlighting features such as stronger reasoning, long-context handling, faster performance, and cost changes" Style: premium digital editorial illustration, source-backed research mood, clean composition, high detail, m
openai.com

網上關於 GPT-5.5「Spud」的說法很多，但真正能夠獨立核實的部分很窄。較穩陣的結論是：有媒體報道 OpenAI 正準備一個代號「Spud」的模型，The Decoder 亦轉述稱這個模型已完成 pretraining；但這仍然不是 OpenAI 官方發布、API entry、model card、system card，亦不是可重現 benchmark。

先講結論：Spud 可能存在，但「GPT-5.5」仍未確認

以本次可查資料計，Spud 最強的證據來自媒體報道鏈，而不是社交截圖、YouTube 標題或 demo 圖。The Information 有一篇題為《OpenAI CEO Shifts Responsibilities, Preps ‘Spud’ AI Model》的報道；The Decoder 其後轉述稱，OpenAI reportedly finished pretraining 一個代號為 Spud 的新 AI model，消息來自 Sam Altman 對員工的內部 memo。

這足以令「Spud 是 OpenAI 內部模型代號」成為值得追蹤的說法，但仍未等於公開產品。OpenAI API Models 來源在本次材料中列出的是 gpt-5.4、gpt-5.4-mini、gpt-5.4-nano，未能確認 Spud 或 GPT-5.5 已公開可用。

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

使用 Studio Global AI 搜尋並查核事實

人們還問

「GPT-5.5「Spud」事實核查：benchmark、demo 同發布傳聞有幾可信？」的簡短答案是什麼？

最可核實的結論：Spud 有具名媒體報道指是 OpenAI 正準備的模型，The Decoder 轉述稱已完成 pretraining；但本次可查 OpenAI API Models 只列出 gpt 5.4 系列，未見 GPT 5.5／Spud，所以 benchmark、demo 同發布日期仍未算已驗證。[23][26][21]

首先要驗證的關鍵點是什麼？

最可核實的結論：Spud 有具名媒體報道指是 OpenAI 正準備的模型，The Decoder 轉述稱已完成 pretraining；但本次可查 OpenAI API Models 只列出 gpt 5.4 系列，未見 GPT 5.5／Spud，所以 benchmark、demo 同發布日期仍未算已驗證。[23][26][21] 常見的 77.80% vs 57.70% 是 Holter 文中 Claude Mythos Preview 與 GPT 5.4 的 SWE bench Pro 比較，不是 Spud 的公開原始分數；本次 SWE bench 來源亦未提供 Spud entry。[3][30]

接下來在實務上我該做什麼？

3D、SVG、網站與遊戲 demo 目前多屬二手轉述；Geeky Gadgets 明言資料來自 Universe of AI，並寫到官方 performance metrics 仍未公開。[4]

來源

網傳 claim	目前可核實到甚麼	判定
OpenAI 有一個代號「Spud」的新模型	The Information 題名直接提到 OpenAI 正準備「Spud」AI model；The Decoder 轉述稱 OpenAI reportedly finished pretraining a new AI model codenamed Spud。	部分交叉印證，但未官方確認
Spud 已公開，或將以 GPT-5.5 名義推出	本次 OpenAI API Models 來源列出 gpt-5.4 系列，未能確認 Spud／GPT-5.5 已公開。	未驗證
Spud benchmark 追近或超越 Claude Mythos	Holter 文中的 77.80% 是 Claude Mythos Preview 在 SWE-bench Pro 的數字，57.70% 是 GPT-5.4；對 Spud 的描述是 expectation 語氣，不是 Spud 原始分數。	未驗證
SWE-bench 已有 Spud 成績	SWE-bench 有公開 leaderboard，但本次來源材料未提供可直接對應 Spud 的提交、結果頁或 eval card。	未驗證
3D worlds、SVG、網站設計、互動遊戲 demo 證明 Spud 能力	Geeky Gadgets 寫明是「According to Universe of AI」的轉述，並提到 official performance metrics remain undisclosed。	二手轉述，不能當能力證明
April 16、Q2 2026、一定叫 GPT-5.5	有文章將 Spud 寫成 GPT-5.5 並預期 Q2／April–May 2026；Holter 標題亦使用「Leaked April 16 Release」與「GPT-5.5 or GPT-6 Might Mean」這類未定語氣。	偏 rumor，未驗證
OpenAI Developer Community 出現「SPUD Release」字眼	相關頁面標題是「Please Add an Optional Expression Mode with the SPUD Release」，語境是 feature request，不是 release note、API 文件或 model card。	不能當官方確認