有可能變貴:Anthropic 文件指出,Claude Opus 4.7 的新 tokenizer 處理文字時,可能使用先前模型約 1x 至 1.35x 的 tokens,最高約多 35%,但增幅依內容而異。[34]
目前不宜把「GPT 5.5 Spud」視為 OpenAI 已正式確認或已可用的模型;可核查的官方文件仍指向 GPT 5,以及 API 文件中的「Latest: GPT 5.4」。[11][13][14][16]
沒有一個模型能在所有情境都當「總冠軍」;依官方功能與產品定位來看,搜尋/事實查核初稿可先試 ChatGPT,Google Search、Gmail、Docs 工作流看 Gemini,coding/agents/多步驟任務則優先測 Claude Opus 4.7。[5][35][37][33]
已審閱的 OpenAI 官方資料未確認公開的 GPT 5.5「Spud」模型,也未見 Spud 專屬長上下文基準;官方文件目前指向 GPT 5.4。
Claude Opus 4.7 是可核對的官方模型;GPT 5.5 Spud 在本次提供的 OpenAI 官方資料中未被驗證,因此沒有證據支持 Claude 對 Spud 的幻覺勝負結論 [12][16][23][25][26][29][45]。
Claude Opus 4.7 是這批資料中可由 Anthropic 與 AWS 文件驗證的模型;OpenAI 官方資料在此只能證明 GPT 5 與 API/平台控制,而非 GPT 5.5 Spud [1][5][12][25][27][57]。
目前不能判定 GPT 5.5 Spud 或 Claude Opus 4.7 哪個更適合交付研究報告:缺少同題 A/B 原始輸出、盲評和逐條查核,而且可核對的 OpenAI 官方模型文件列的是 GPT 5.4 / GPT 5.4 pro,不是 GPT 5.5 Spud。[80][81][82]
ChatGPT 記憶不是完整逐字備份:OpenAI 將 Memory 分為 saved memories 與 chat history,主要用來個人化回覆;官方也說 ChatGPT 不會記住過往對話的每個細節。[20][17]
目前不能得出 GPT 5.5「Spud」的可靠可控性結論:相關來源指出 OpenAI 尚未正式確認 Spud,也未公布官方發布日、模型卡或 API 定價。[13][16]
目前不能把 GPT 5.5 Spud 當成已確認的全模態模型:Spud 線索主要來自非官方與社群來源;OpenAI 官方資料只證明 GPT 4o、4o 圖像生成、Realtime API、Sora 等多模態能力存在,不能證明它們已被 Spud 統一。[1][2][12][15][18][20][21]
在本次檢視的 OpenAI 公開文件中,GPT 5.5 Spud 尚未被確認為已發布模型;官方脈絡指向 GPT 5.4、GPT 5 Codex/Codex、Responses API、Agents SDK 與工具指南。
目前公開證據不足:未見可公開核查、直接命名 GPT 5.5 Spud 的 system card、紅隊報告或 Preparedness/alignment 文件;這不等於內部一定沒有做,只代表不能當作公開證據引用。