レポート公開済み3 か月前Last edited 2 か月前18 ソース

GPT-5.5「Spud」リーク検証：ベンチマーク、デモ、公開時期はどこまで信用できる？

現時点で比較的根拠があるのは、OpenAIが「Spud」というコードネームのモデルを準備しているとする媒体報道と、事前学習完了を伝えるThe Decoderの報道です。ただし、OpenAI APIの資料上ではSpud／GPT 5.5の公開は確認できません。[23][26][21] よく引用される77.80％と57.70％は、Holter記事で示されたClaude Mythos PreviewとGPT 5.4のSWE bench Pro比較であり、Spudの公開済みスコアではありません。SWE bench側の資料でも、本稿の範囲ではSpudのエントリーは確認できません。[3][30] 3D、SVG、Webサイト、ゲーム生成などの...

Studio Global AIで検索して事実確認さらにトレンドページを見る

GPT-5.5「Spud」傳聞事實核查的抽象 AI 編輯室畫面 — GPT-5.5「Spud」事實核查：benchmark、demo、release leak 有幾多可信？AI-generated editorial illustration for a fact-check on GPT-5.5「Spud」benchmark、demo 與 release leak 傳聞。
AI プロンプト
Create a landscape editorial hero image for this Studio Global article: GPT-5.5「Spud」事實核查：benchmark、demo、release leak 有幾多可信？. Article summary: 最可核實的結論係：Spud 可能是 OpenAI 內部模型代號，且有媒體轉述稱已完成 pretraining；但本次可查 OpenAI API model list 未列出 GPT 5.5／Spud，提供材料亦未有 model card 或 system card。[23][26][21]. Topic tags: ai, openai, chatgpt, llm, ai benchmarks. Reference image context from search candidates: Reference image 1: visual subject "Spud 是一個能媲美Claude Mythos 的模型，應該也是一個超大的模型，可能10 兆參數左右. 個人不覺得它會叫GPT-5.5，應該會是GPT-6 才合理. 135." source context "OpenAI推出代號「Spud」的GPT‑5.5 面向企業的更強AI模型加速登場" Reference image 2: visual subject "A detailed infographic summarizes updates and improvements in GPT-5.5, highlighting features such as stronger reasoning, long-context handling, faster performance, and cost changes" Style: premium digital editorial illustration, source-backed research mood, clean composition, high detail, m
openai.com

ネット上では、OpenAIの次期モデルとされる「Spud」について、ベンチマーク、デモ動画、公開日、さらには「GPT-5.5」という製品名まで、さまざまな情報が出回っています。結論から言うと、確認できる範囲はかなり狭いです。

もっとも慎重な見方はこうです。The InformationはOpenAIが「Spud」というAIモデルを準備していると報じ、The Decoderも、Sam Altman氏が従業員向けの内部メモでコードネーム「Spud」の新モデルについて述べ、事前学習を終えたと伝えています。ただしこれは、OpenAIの公式リリース、APIのモデル一覧、model card、system card、再現可能なベンチマークとは別物です。本稿で参照できるOpenAI APIのモデル資料では、gpt-5.4、gpt-5.4-mini、gpt-5.4-nanoが示されており、SpudまたはGPT-5.5が公開モデルとして確認できる状態ではありません。

まず結論：Spudは「あり得る」が、GPT-5.5は未確認

「Spud」という名前については、単なるSNSのスクリーンショットよりは強い根拠があります。The Informationの記事タイトルは、OpenAIが「Spud」AIモデルを準備していることを直接示しています。またThe Decoderは、OpenAIがコードネーム「Spud」の新AIモデルの事前学習を終えたと報じています。

ただし、ここで確認できるのはあくまで「報道された内部コードネームと開発進捗」です。公開製品名がGPT-5.5になるのか、いつ使えるのか、APIで提供されるのか、どの程度の性能なのかまでは確認できません。

したがって、現時点で最も正確な表現は、**「SpudはOpenAIの内部モデルコードネームとして報じられているが、公開名称、性能スコア、リリース時期、API提供は公式資料や再現可能なベンチマークでは未確認」**です。

AIモデルのリークを判断する基準

AIモデルの噂は、拡散量よりも「たどれる証拠」が重要です。厳しく見るなら、次のようなものが必要になります。

OpenAIの公式ドキュメント、APIモデル一覧、リリースノート、model card、system card
公開ベンチマークのエントリー、eval card、実行ログ、プロンプトセット、提出記録
元のデモ動画、実行時のプロンプト、生成過程、モデル名、タイムスタンプ
第三者が同じ手順で近い結果を再現できるテスト

この基準で見ると、Spudについては「存在や事前学習完了を示す報道」はありますが、ネットで見かけるベンチマーク、デモ、公開日、GPT-5.5という名称の多くは、まだ確認済みとは言えません。

主要な噂の信頼度

噂・主張	現時点で確認できること	判定
OpenAIに「Spud」という新モデルがある	The Informationが「Spud」AIモデルの準備を報じ、The DecoderもSpudの事前学習完了を伝えている。	一部報道で裏取りあり。ただし公式確認ではない
Spudはすでに公開済み、またはGPT-5.5として出る	本稿で参照できるOpenAI APIモデル資料では、Spud／GPT-5.5の公開は確認できない。	未検証
SpudはClaude Mythos級のベンチマークを出している	Holter記事の77.80％はClaude Mythos Preview、57.70％はGPT-5.4の数値で、Spudについては期待・推測の書き方になっている。	未検証
SWE-benchにSpudの成績がある	SWE-benchには公開リーダーボードがあるが、本稿の資料範囲ではSpudに対応するエントリーやeval cardは確認できない。	未検証
3D世界、SVG、Webデザイン、ゲーム生成デモがSpudの能力を証明している	Geeky Gadgetsは「Universe of AIによると」として紹介しており、公式性能指標は未公開だと書いている。	二次情報。能力証明としては弱い
2026年4月16日、Q2、GPT-5.5という名称が確定	SpudをGPT-5.5として扱い、2026年Q2や4〜5月を予想する記事はある。Holter記事も「Leaked April 16 Release」「GPT-5.5 or GPT-6 Might Mean」といった不確定な表現を使っている。	噂寄り。未確認
OpenAI Developer Communityの「SPUD Release」は公式発表	該当ページは「Please Add an Optional Expression Mode with the SPUD Release」というユーザーの機能要望であり、リリースノートやAPI文書ではない。	公式確認とは言えない

ベンチマーク：他モデルの数字をSpudの実績と混同しない

最も誤解されやすいのがベンチマークです。Holter記事では、Claude Mythos PreviewがSWE-bench Proで77.80％、GPT-5.4が57.70％だったと書かれています。しかし、Spudについての記述は「その差をかなり、またはすべて埋めるという期待がある」という趣旨であり、Spudの公開済みスコアを示しているわけではありません。

つまり、この数字から言えるのは「他モデルの成績をもとに、Spudが近づくのではないかと推測する記事がある」ということまでです。「Spudが77.80％を出した」「Claude Mythosを超えた」と断定するには足りません。

本当にベンチマークとして扱うなら、少なくとも公式レポート、model card、system card、公開リーダーボードの行、eval card、実行ログ、プロンプトセット、提出記録、または第三者による再現テストが必要です。SWE-bench自体はコーディング能力を確認するための公開リーダーボードですが、本稿で示された資料にはSpudの確認可能なエントリーはありません。

デモ：面白い動画と「証拠」は別

Spud関連として、3Dシミュレーション、インタラクティブ環境、Webサイトデザイン、SVG、ゲーム生成などのデモが語られています。問題は、それらが必ず偽物だということではありません。問題は、現時点では「本当にSpudが生成したのか」「同じ条件で再現できるのか」が確認できないことです。

Geeky Gadgetsの記事は、Spudが3DシミュレーションやWeb開発に優れているとする内容を「Universe of AIによると」として紹介しており、同時に公式の性能指標はまだ公開されていないとも書いています。そのため、これらは現段階では「ネット上で紹介された出力例」または「二次的なデモ紹介」として扱うのが妥当です。

信頼できる証拠として扱うには、元動画、完全なプロンプト、生成手順、モデル名、実行時刻、再現手順、またはOpenAI公式のデモページが必要です。

公開日と名称：GPT-5.5、GPT-6、4月16日はまだ確定ではない

「SpudはGPT-5.5として出る」「2026年4月16日に公開される」といった話は目を引きますが、確認のハードルは高く見るべきです。SpudをGPT-5.5として紹介し、2026年第2四半期や4〜5月のリリースを予想する記事はあります。一方、Holter記事のタイトルも「Leaked April 16 Release」や「GPT-5.5 or GPT-6 Might Mean」という表現で、断定ではなくリーク・可能性の枠組みです。

OpenAIが公式ブログ、リリースノート、APIモデル一覧、開発者向けドキュメントで名称と提供状況を出すまでは、「GPT-5.5」は外部の呼び名または推測として扱うのが安全です。本稿で参照できるOpenAI APIのモデル資料からは、Spud／GPT-5.5の公開は確認できません。

Developer Communityの投稿はリリース証拠ではない

OpenAI Developer Community上に「SPUD Release」という言葉が出ていることも、スクリーンショットだけで見ると公式の示唆に見えるかもしれません。しかし該当ページのタイトルは「Please Add an Optional Expression Mode with the SPUD Release」で、文脈はユーザーによる機能要望です。

フォーラム投稿は「コミュニティでSpudが話題になっている」ことの材料にはなりますが、OpenAIがSpudを発表した証拠にはなりません。

開発者やプロダクト担当者はどう扱うべきか

業務で使うAIモデルを選ぶ場合、噂ベースの性能値を前提にロードマップや調達判断を置くのは危険です。現時点では、次のように切り分けるのが現実的です。

利用可能なモデルは、OpenAIの公式APIモデル資料を基準にする。本稿の資料ではgpt-5.4系が確認でき、Spud／GPT-5.5は確認できない。
コーディング性能の主張には、公開リーダーボード、eval card、再現可能なテストを求める。SWE-benchのような公開リーダーボードは確認先になる。
デモには、元動画、完全なプロンプト、モデル名、タイムスタンプ、再現手順を求める。単独の動画、スクリーンショット、二次記事だけでは足りない。
公開日や製品名は、公式リリースノートまたはAPIエントリーが出るまで保留する。「leaked」「expected」「might」という表現自体が不確実性を示している。

最終判定

Spudは、まったく根拠のない名前ではなさそうです。The InformationがOpenAIの「Spud」モデル準備を報じ、The DecoderもSpudの事前学習完了を伝えています。

ただし、信頼して使える結論はかなり限定的です。現時点では、ネット上のベンチマーク、3Dデモ、公開日、GPT-5.5という名称を、独立に検証済みの事実として扱うべきではありません。

外部に説明するなら、最も無難なのは次の一文です。SpudはOpenAIの内部モデルコードネームとして報じられているが、公開名称、性能、スコア、リリース時期は、OpenAIの公式資料または再現可能なベンチマークではまだ確認されていない。

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Studio Global AIで検索して事実確認

人々も尋ねます