GPT-5.5 „Spud“ im Faktencheck: Was ist an Benchmarks, Demos und Release-Leaks dran?
Am besten belegt ist nur der Kern: The Information berichtet über ein von OpenAI vorbereitetes „Spud“ Modell, The Decoder schreibt von abgeschlossenem Pretraining; in den vorliegenden OpenAI API Dokumenten erscheinen... Die häufig zitierten 77,80 % und 57,70 % stammen aus einem Vergleich von Claude Mythos Preview un...
GPT-5.5「Spud」事實核查:benchmark、demo、release leak 有幾多可信?AI-generated editorial illustration for a fact-check on GPT-5.5「Spud」benchmark、demo 與 release leak 傳聞。
AI 提示
Create a landscape editorial hero image for this Studio Global article: GPT-5.5「Spud」事實核查:benchmark、demo、release leak 有幾多可信?. Article summary: 最可核實的結論係:Spud 可能是 OpenAI 內部模型代號,且有媒體轉述稱已完成 pretraining;但本次可查 OpenAI API model list 未列出 GPT 5.5/Spud,提供材料亦未有 model card 或 system card。[23][26][21]. Topic tags: ai, openai, chatgpt, llm, ai benchmarks. Reference image context from search candidates: Reference image 1: visual subject "Spud 是一個能媲美Claude Mythos 的模型,應該也是一個超大的模型,可能10 兆參數左右. 個人不覺得它會叫GPT-5.5,應該會是GPT-6 才合理. 135." source context "OpenAI推出代號「Spud」的GPT‑5.5 面向企業的更強AI模型加速登場" Reference image 2: visual subject "A detailed infographic summarizes updates and improvements in GPT-5.5, highlighting features such as stronger reasoning, long-context handling, faster performance, and cost changes" Style: premium digital editorial illustration, source-backed research mood, clean composition, high detail, m
openai.com
Im Netz kursieren viele Behauptungen über GPT-5.5 „Spud“: neue Benchmark-Rekorde, beeindruckende 3D-Demos, angebliche Release-Fenster und sogar ein möglicher Produktname. Der belastbare Teil ist deutlich kleiner. The Information führte ein von OpenAI vorbereitetes KI-Modell mit dem Codenamen „Spud“ im Titel; The Decoder berichtete anschließend, OpenAI habe das Pretraining eines neuen Modells mit diesem Codenamen abgeschlossen.[23][26] In den hier vorliegenden offiziellen OpenAI-API-Modellseiten stehen dagegen gpt-5.4, gpt-5.4-mini und gpt-5.4-nano – nicht Spud oder GPT-5.5.[21]
Kurz gesagt: Spud kann ein realer interner Codename sein. Aber GPT-5.5 als öffentlicher Produktname, konkrete Benchmark-Werte, Demo-Fähigkeiten und ein Release-Datum sind derzeit nicht unabhängig belegt.[23]
Studio Global AI
Search, cite, and publish your own answer
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
Am besten belegt ist nur der Kern: The Information berichtet über ein von OpenAI vorbereitetes „Spud“ Modell, The Decoder schreibt von abgeschlossenem Pretraining; in den vorliegenden OpenAI API Dokumenten erscheinen...
Die häufig zitierten 77,80 % und 57,70 % stammen aus einem Vergleich von Claude Mythos Preview und GPT 5.4 in einem Holter Artikel – sie sind kein veröffentlichter Spud Benchmark.
Die kursierenden 3D , SVG , Website und Spiele Demos sind derzeit eher Hinweise als Beweise: Geeky Gadgets verweist auf Universe of AI und schreibt zugleich, dass offizielle Performance Metriken nicht veröffentlicht s...
人們還問
「GPT-5.5 „Spud“ im Faktencheck: Was ist an Benchmarks, Demos und Release-Leaks dran?」的簡短答案是什麼?
Am besten belegt ist nur der Kern: The Information berichtet über ein von OpenAI vorbereitetes „Spud“ Modell, The Decoder schreibt von abgeschlossenem Pretraining; in den vorliegenden OpenAI API Dokumenten erscheinen...
首先要驗證的關鍵點是什麼?
Am besten belegt ist nur der Kern: The Information berichtet über ein von OpenAI vorbereitetes „Spud“ Modell, The Decoder schreibt von abgeschlossenem Pretraining; in den vorliegenden OpenAI API Dokumenten erscheinen... Die häufig zitierten 77,80 % und 57,70 % stammen aus einem Vergleich von Claude Mythos Preview und GPT 5.4 in einem Holter Artikel – sie sind kein veröffentlichter Spud Benchmark.
接下來在實務上我該做什麼?
Die kursierenden 3D , SVG , Website und Spiele Demos sind derzeit eher Hinweise als Beweise: Geeky Gadgets verweist auf Universe of AI und schreibt zugleich, dass offizielle Performance Metriken nicht veröffentlicht s...
接下來我應該探索哪個相關主題?
繼續“Claude Opus 4.7、GPT-5.5、DeepSeek V4、Kimi K2.6:2026 Benchmark 點睇先唔會睇錯”以獲得另一個角度和額外的引用。
GPT-5.5 Spud: Everything About OpenAI Next Frontier Model. GPT-5.5 Spud is OpenAI next frontier model: pretraining complete, Q2 2026 release expected. GPT-5.5 , code-named "Spud" , is the next frontier model from OpenAI. GPT-5.5 Spud OpenAI next AI model le...
OpenAI Spud: Leaked April 16 Release, Mythos-Level Benchmarks, and What GPT-5.5 or GPT-6 Might Mean. Claude Mythos Preview posted 77.80% on SWE-bench Pro. GPT-5.4 is at 57.70%. OpenAI has been signaling that Spud, their next model, closes that gap. Before M...
According to Universe of AI, Spud demonstrates remarkable proficiency in areas such as 3D simulations and web development, with early tests showcasing its ability to create detailed interactive environments and professional-grade website designs. Dive into...
It's about enabling more natural and flexible creative expression for legitimate writing and storytelling. What this would allow: - Non- ... Mar 28, 2026
Das Wichtigste vorweg: Spud ist plausibel, GPT-5.5 nicht bestätigt
Für „Spud“ gibt es mehr als nur Social-Media-Geraune. Die stärkste Spur ist eine Medienkette: The Information veröffentlichte einen Artikel mit dem Titel „OpenAI CEO Shifts Responsibilities, Preps ‘Spud’ AI Model“; The Decoder schrieb danach, OpenAI habe laut einem internen Memo von Sam Altman das Pretraining eines neuen KI-Modells mit dem Codenamen Spud abgeschlossen.[23][26]
Das reicht, um Spud als berichteten internen OpenAI-Codenamen ernst zu nehmen. Es ist aber keine offizielle Veröffentlichung. Es gibt in den geprüften Unterlagen keinen API-Eintrag, keine öffentlich zitierte Model Card, keinen System Card-Nachweis und keinen reproduzierbaren Benchmark, der Spud als nutzbares Modell bestätigt.[21][30]
Die präziseste Formulierung lautet daher: Spud ist ein von Medien berichteter interner Modell-Codename bei OpenAI. Öffentlicher Name, Leistungswerte, Release-Zeitpunkt und API-Verfügbarkeit sind bislang nicht durch OpenAI-Dokumente oder reproduzierbare Benchmarks belegt.[23][26][21]
Woran man belastbare KI-Leaks erkennt
Bei KI-Modellen ist die Lautstärke eines Gerüchts kein Qualitätsmerkmal. Entscheidend ist, ob die Spur zurückverfolgbar ist. Belastbarer wären zum Beispiel:
offizielle Dokumente wie API-Modelllisten, Release Notes, Model Cards oder System Cards;
ein öffentlicher Benchmark-Nachweis, etwa ein Leaderboard-Eintrag, eine Eval Card, ein Run Log, ein Prompt-Set oder ein Submission-Link;
ein Original-Demo-Artefakt mit vollständigem Video, Prompt, Generierungsprozess, Modellname und Zeitstempel;
ein Test, den unabhängige Dritte mit ähnlichem Ergebnis wiederholen können.
Nach diesem Maßstab ist die Existenz beziehungsweise der Trainingsfortschritt von Spud teilweise durch Medienberichte gestützt. Die meisten kursierenden Aussagen zu Benchmarks, Demos, Release-Datum und GPT-5.5-Namen erreichen diese Schwelle jedoch nicht.[23][26][3][4][21]
Claim-Check: Was lässt sich derzeit prüfen?
Behauptung
Was sich belegen lässt
Einordnung
OpenAI hat ein neues Modell mit dem Codenamen „Spud“
The Information nennt ein von OpenAI vorbereitetes „Spud“-KI-Modell; The Decoder berichtet, OpenAI habe das Pretraining eines neuen Modells mit diesem Codenamen abgeschlossen.[23][26]
Teilweise gestützt, aber nicht offiziell bestätigt
Spud ist schon öffentlich oder erscheint sicher als GPT-5.5
Die hier vorliegenden OpenAI-API-Modellseiten nennen die GPT-5.4-Reihe, nicht Spud oder GPT-5.5.[21]
Nicht verifiziert
Spud erreicht oder übertrifft Claude Mythos
Die oft genannten 77,80 % beziehen sich bei Holter auf Claude Mythos Preview in SWE-bench Pro; 57,70 % auf GPT-5.4. Für Spud wird dort Erwartung formuliert, kein Originalwert geliefert.[3]
Nicht verifiziert
SWE-bench enthält bereits ein Spud-Ergebnis
SWE-bench hat öffentliche Leaderboards, aber die vorliegenden Quellen liefern keinen direkt Spud zuordenbaren Eintrag, Ergebnislink oder Eval-Nachweis.[30]
Nicht verifiziert
3D-Welten, SVGs, Websites und Spiele-Demos beweisen Spud-Fähigkeiten
Geeky Gadgets formuliert dies als Verweis auf Universe of AI und schreibt zugleich, offizielle Performance-Metriken seien weiterhin nicht veröffentlicht.[4]
Zweitverwertung, kein belastbarer Fähigkeitsnachweis
16. April, 2. Quartal 2026 oder April/Mai 2026 sind verlässliche Release-Termine
Einzelne Artikel nennen GPT-5.5 und erwartete Zeiträume; Holter arbeitet im Titel mit Formulierungen wie „Leaked April 16 Release“ und „GPT-5.5 or GPT-6 Might Mean“.[1][3]
Eher Gerücht als gesicherte Information
Ein OpenAI-Forumstitel mit „SPUD Release“ bestätigt den Launch
Der OpenAI-Developer-Community-Beitrag heißt „Please Add an Optional Expression Mode with the SPUD Release“ und ist ein Feature Request, keine Release Note, API-Dokumentation oder Model Card.[13]
Keine offizielle Bestätigung
Benchmarks: Die prominentesten Zahlen gehören nicht zu Spud
Der heikelste Teil der Spud-Gerüchte sind die Benchmarks. Zahlen wirken konkret – auch dann, wenn sie gar nicht das behauptete Modell beschreiben.
Im Holter-Artikel werden 77,80 % für Claude Mythos Preview in SWE-bench Pro und 57,70 % für GPT-5.4 genannt. Die zentrale Aussage zu Spud ist aber erwartend formuliert: Spud solle „most or all“ dieser Lücke schließen.[3] Das ist eine Prognose oder Einordnung, kein veröffentlichter Spud-Lauf.
Damit können diese Werte höchstens zeigen, wie andere Modelle in einem Vergleich dargestellt wurden. Sie belegen nicht, dass Spud bereits einen unabhängig geprüften Benchmark-Score hat. Für eine belastbare Aussage bräuchte es mindestens einen offiziellen Benchmark-Bericht, eine Model Card, eine System Card, einen öffentlichen Leaderboard-Eintrag, eine Eval Card, Run Logs, ein Prompt-Set, eine Submission oder reproduzierbare Tests Dritter.
SWE-bench selbst ist als öffentliches Leaderboard ein sinnvoller Ausgangspunkt, um Coding-Benchmark-Behauptungen zu prüfen. In den hier vorliegenden Quellen findet sich jedoch kein nachvollziehbarer Spud-Eintrag.[30]
Demos: Als Hinweis interessant, als Beweis zu dünn
Zu Spud kursieren angebliche Demos mit 3D-Simulationen, interaktiven Umgebungen, Website-Designs, SVG-Grafiken und kleinen Spielen. Das Problem ist nicht, dass solche Demos unmöglich wären. Das Problem ist die Belegkette.
Geeky Gadgets schreibt die Informationen ausdrücklich als „According to Universe of AI“ zu und verweist zugleich darauf, dass offizielle Performance-Metriken nicht veröffentlicht seien.[4] Damit handelt es sich derzeit eher um eine Weitererzählung von angeblichen Outputs als um einen überprüfbaren Nachweis.
Ein belastbarer Demo-Beleg müsste mehr liefern: die Originalquelle, das vollständige Video, den Prompt, die Generierungsschritte, den Modellnamen, Zeitstempel und idealerweise eine Möglichkeit zur Wiederholung. Ohne diese Artefakte bleibt eine Demo ein Signal – kein Beweis für Spuds tatsächliche Fähigkeiten.
Name und Termin: GPT-5.5, GPT-6 und der 16. April bleiben offen
Besonders schnell verbreiten sich Behauptungen, die einen klaren Namen oder ein klares Datum versprechen. Genau hier ist Vorsicht angebracht.
Ein Artikel stellt Spud als GPT-5.5 dar und nennt erwartete Zeiträume wie das 2. Quartal beziehungsweise April/Mai 2026. Holter wiederum formuliert im Titel mit „Leaked April 16 Release“ und „GPT-5.5 or GPT-6 Might Mean“ erkennbar vorsichtig und spekulativ.[1][3]
Aus Faktencheck-Sicht reicht das nicht für eine Bestätigung. Solange OpenAI den Namen, die Verfügbarkeit und die Nutzung nicht in offiziellen Model Docs, API-Seiten, Release Notes oder im eigenen Blog aufführt, bleibt „GPT-5.5“ eine externe Bezeichnung oder Vermutung. Die geprüfte OpenAI-API-Seite bestätigt Spud oder GPT-5.5 nicht.[21]
Warum ein Community-Forum kein Release-Beleg ist
Ein weiterer Stolperstein sind Screenshots aus Foren. In der OpenAI Developer Community gibt es einen Beitrag mit dem Titel „Please Add an Optional Expression Mode with the SPUD Release“.[13] Das kann auf den ersten Blick wie ein offizieller Hinweis wirken.
Der Kontext ist aber entscheidend: Der Beitrag ist eine Feature-Anfrage eines Community-Mitglieds, keine OpenAI-Release-Note, keine API-Dokumentation und keine Model Card.[13] Er belegt also, dass Spud in der Community diskutiert wird. Er belegt nicht, dass OpenAI Spud veröffentlicht hat.
Was Entwickler und Produktteams daraus machen sollten
Wer Roadmaps, Agenten-Workflows, Coding-Tools oder Beschaffungsentscheidungen plant, sollte Spud-Gerüchte nicht wie gesicherte Modellinformationen behandeln. Sinnvoller ist eine nüchterne Checkliste:
Verfügbarkeit: Nur offizielle API-Dokumentation als Grundlage nehmen. In den geprüften OpenAI-Unterlagen erscheinen Modelle der GPT-5.4-Reihe, nicht Spud oder GPT-5.5.[21]
Coding-Leistung: Bei Benchmark-Claims nach Leaderboard-Eintrag, Eval Card oder reproduzierbarem Test fragen. SWE-bench ist ein naheliegender Abgleichspunkt, aber die vorliegenden Quellen zeigen keinen Spud-Eintrag.[30]
Demo-Qualität: Nicht auf Screenshots oder zusammengeschnittene Videos allein vertrauen. Ohne Originalartefakt, Prompt, Modellname und Reproduktionsweg bleibt die Aussage schwach.[4]
Release-Planung: Begriffe wie „leaked“, „expected“ oder „might“ sind Warnsignale für Unsicherheit. Für belastbare Planung zählen Release Notes, API-Einträge oder offizielle OpenAI-Kommunikation.[1][3][21]
Urteil
Spud ist nicht einfach aus der Luft gegriffen: Es gibt benannte Medienberichte, wonach OpenAI ein Modell mit diesem Codenamen vorbereitet und dessen Pretraining abgeschlossen haben soll.[23][26] Daraus folgt aber nicht, dass GPT-5.5 schon bestätigt, öffentlich verfügbar oder benchmark-verifiziert ist.
Die derzeit sauberste Einordnung lautet: Spud ist ein berichteter interner OpenAI-Codename. Benchmark-Rekorde, 3D-Demos, Release-Daten und der Name GPT-5.5 sind nach den vorliegenden Quellen nicht unabhängig bestätigt.[3][4][21][30]
Start with gpt-5.4 for complex reasoning and coding, or choose gpt-5.4-mini and gpt-5.4-nano for lower-latency, lower-cost workloads. View all. Compare models.
OpenAI CEO Sam Altman has relinquished direct oversight of the company's safety and security teams so he can focus on raising capital, ... Mar 24, 2026
OpenAI has reportedly finished pretraining its new AI model, codenamed "Spud," CEO Sam Altman told employees in an internal memo, according ... Mar 25, 2026