GPT 4.1 家族據報最高支援 100 萬 context tokens;這足以讓單一合約、成包研究資料與整理過的小中型 repo 進入一次任務,但它只擴大容量,不保證模型穩定找出每個關鍵片段。[5][6][3]
最快的檢查入口是 ChatGPT 與 Codex:ChatGPT 選 Instant 時,系統可能自動使用 GPT 5.3 Instant 或 GPT 5.5 Thinking;Codex 文件則寫明,以 ChatGPT 登入時可用 GPT 5.5。[14][13]
公開資料能支持的結論是:OpenAI 確實在強化更自然、更能理解細微信號、能處理敏感對話的 ChatGPT 體驗;但沒有公開證據足以證明寫作能力整體退化。[55][28][24]
較可核實的部分是:The Information 報導 OpenAI 正準備代號 Spud 的模型,The Decoder 轉述稱其已完成預訓練;但這仍不是 OpenAI 官方發布。[23][26]
OpenAI 的 API Pricing 頁面片段列出 GPT image 2:Inputs 為 $8.00、Cached inputs 為 $2.00,但目前資料未能證實「每生成一張圖多少錢」的固定總價。[2]
本次資料未證實 GPT 5.5 Spud 是公開 OpenAI API 模型;OpenAI 模型索引標示 Latest: GPT 5.4,定價節錄也只見 gpt 5.4 與 gpt 5.4 mini [19][1]。
有可能變貴:Anthropic 文件指出,Claude Opus 4.7 的新 tokenizer 處理文字時,可能使用先前模型約 1x 至 1.35x 的 tokens,最高約多 35%,但增幅依內容而異。[34]
目前不宜把「GPT 5.5 Spud」視為 OpenAI 已正式確認或已可用的模型;可核查的官方文件仍指向 GPT 5,以及 API 文件中的「Latest: GPT 5.4」。[11][13][14][16]
沒有一個模型能在所有情境都當「總冠軍」;依官方功能與產品定位來看,搜尋/事實查核初稿可先試 ChatGPT,Google Search、Gmail、Docs 工作流看 Gemini,coding/agents/多步驟任務則優先測 Claude Opus 4.7。[5][35][37][33]
已審閱的 OpenAI 官方資料未確認公開的 GPT 5.5「Spud」模型,也未見 Spud 專屬長上下文基準;官方文件目前指向 GPT 5.4。
Claude Opus 4.7 是可核對的官方模型;GPT 5.5 Spud 在本次提供的 OpenAI 官方資料中未被驗證,因此沒有證據支持 Claude 對 Spud 的幻覺勝負結論 [12][16][23][25][26][29][45]。
目前不能判定 GPT 5.5 Spud 或 Claude Opus 4.7 哪個更適合交付研究報告:缺少同題 A/B 原始輸出、盲評和逐條查核,而且可核對的 OpenAI 官方模型文件列的是 GPT 5.4 / GPT 5.4 pro,不是 GPT 5.5 Spud。[80][81][82]