Wer GPT Image 2 mit GPT Image 1.5 vergleicht, sollte zwei Fragen sauber trennen: Ist das neue Modell qualitativ besser? Und sind die API-Parameter tatsächlich großzügiger? Bei den drei besonders praktischen Punkten — frei wählbare Bildgröße, Seitenverhältnis und Referenzbilder — lässt sich aus den vorliegenden Quellen nur ein vorsichtiges Fazit ziehen: Die Modellseiten und Images-API-Endpunkte existieren, aber eine offizielle, zahlenbasierte Gegenüberstellung der Limits ist in den bereitgestellten Auszügen nicht zu erkennen.[1][
13][
15][
21]
Ergebnis des Checks: „Mehr Freiheit“ ist derzeit nicht belegt
Aktuell sollte man GPT Image 2 nicht pauschal als Modell beschreiben, das „beliebigere Größen“, „mehr Seitenverhältnisse“ oder „mehr Referenzbilder“ unterstützt. Belegt ist: Es gibt eine OpenAI-Modellseite zu GPT Image 1.5 und eine zu GPT Image 2; außerdem dokumentiert OpenAI Images-API-Endpunkte für Generierung und Bearbeitung.[1][
13][
15][
21]
Was in den vorliegenden Quellen jedoch fehlt, ist eine vollständige Gegenüberstellung dieser Punkte:
- zulässige Werte für
sizeoder Breite/Höhe, - ob freie Abmessungen unterstützt werden oder nur feste Größen,
- eine offizielle Liste verfügbarer Seitenverhältnisse,
- Anzahl, Format, Dateigröße oder Regeln für Referenzbilder und Mehrbild-Eingaben.
Die präzisere Formulierung lautet deshalb: GPT Image 2 kann in anderen Bereichen Verbesserungen haben; wie viel freier es bei Größe, Seitenverhältnis und Referenzbild-Eingaben ist, lässt sich mit den vorliegenden Belegen aber nicht quantifizieren.
Was die offiziellen Quellen tatsächlich zeigen
Die OpenAI-Modellseite beschreibt GPT Image 1.5 als Bildgenerierungsmodell und nennt unter anderem besseres Befolgen von Anweisungen sowie stärkere Prompt-Treue.[1] Eine OpenAI-API-Modellseite für GPT Image 2 ist ebenfalls vorhanden.[
21]
Die Images-API-Referenz zeigt Endpunkte für „Generate an Image“ und „Edit an Image“.[13][
15] In den Python- und TypeScript-Referenzen zu Images werden außerdem Angaben zu GPT image models genannt, darunter die
size eines generierten Bildes sowie Felder wie background, output formatquality.[17][
18]
Das reicht aus, um zu sagen: Bilderzeugung, Bildbearbeitung und Größenfelder kommen in der API-Dokumentation vor. Es reicht aber nicht aus, um belastbar zu sagen, welche Größen GPT Image 1.5 und GPT Image 2 jeweils unterstützen, ob freie Seitenverhältnisse möglich sind oder ob Referenzbild-Limits geändert wurden.[13][
15][
17][
18]
Die drei Limits im Einzelcheck
| Prüffrage | Was vorliegt | Belegt das mehr Freiheit bei GPT Image 2? |
|---|---|---|
| Frei wählbare Größe | OpenAI-Referenzen erwähnen die size eines generierten Bildes; Drittanbieter-Dokumente zu GPT Image 1.5 zeigen außerdem Beispiele mit width, height, image_size oder size bei Edits.[ | Nein. Die Quellen liefern keine vollständige Liste der von GPT Image 1.5 und GPT Image 2 unterstützten Größen, keine Min-/Max-Werte und keinen Beleg für beliebige Breite-Höhe-Kombinationen. |
| Seitenverhältnis / Aspect Ratio | Ein Higgsfield-Tutorial zu GPT Image 1.5 nennt UI-Optionen wie 1:1, 2:3 und 3:2.[ | Nein. Das ist ein Beispiel aus einer Drittanbieter-Oberfläche, keine offizielle OpenAI-Gegenüberstellung der Seitenverhältnisse beider Generationen. |
| Referenzbild-Eingabe | OpenAI dokumentiert einen Image-Edit-Endpunkt; Drittanbieter-Dokumente nennen Felder wie image_reference, size oder input_fidelity.[ | Nicht quantifizierbar. Es fehlt eine offizielle Vergleichsangabe zur Anzahl der Referenzbilder, Eingaberegeln oder Mehrbild-Logik beider Modelle. |
Warum Drittanbieter-Dokumente nicht automatisch OpenAI-Limits sind
Leonardo.AI zeigt für GPT Image 1.5 REST-API-Beispiele mit width, height, seed und guidances.image_reference; fal nennt image_size, background und quality; WaveSpeedAI führt bei einem Edit-Endpunkt size, quality, input_fidelity und output_format auf; Higgsfield listet in einem Tutorial Seitenverhältnisse wie 1:1, 2:3 und 3:2.[2][
5][
6][
11]
Solche Quellen sind hilfreich, wenn man verstehen will, wie Plattformen das Modell in ihre eigenen Produkte einbauen. Sie sind aber keine sichere Aussage über die nativen OpenAI-Grenzen. Drittanbieter können eigene Parameternamen, Standardwerte, UI-Auswahlen, Validierungen oder technische Einschränkungen einziehen. Ein width/height-Feld oder ein Seitenverhältnis-Menü auf einer Plattform ist daher nicht automatisch der vollständige Fähigkeitsrahmen des OpenAI-Modells.[2][
5][
6][
11]
Welche Belege für die Aussage „GPT Image 2 ist freier“ nötig wären
Um zuverlässig zu beantworten, wie viel freier GPT Image 2 gegenüber GPT Image 1.5 ist, bräuchte es mindestens eine dieser Evidenzarten:
- eine offizielle OpenAI-Liste der zulässigen
size-Werte, Maximal- und Minimalwerte oder festen Größen je Modell; - eine offizielle Aussage dazu, ob die Modelle freie Breite-Höhe-Kombinationen oder nur feste Seitenverhältnisse unterstützen;
- dokumentierte Regeln für Image Edits oder Referenzbilder, etwa Anzahl, Dateiformate, Dateigrößen und Mehrbild-Eingaben;
- ein offizielles Changelog, eine Migration Guide oder eine Vergleichstabelle, die geänderte Limits klar benennt;
- reproduzierbare Tests in derselben API-Umgebung, bei denen Größen, Seitenverhältnisse und Referenzbild-Kombinationen systematisch angenommen oder abgelehnt werden.
Bis solche Daten vorliegen, ist „GPT Image 2 ist freier“ eher eine zu prüfende Annahme als eine belastbare Produktangabe.
Empfehlung für Produkt- und Engineering-Teams
Wer einen Wechsel von GPT Image 1.5 auf GPT Image 2 prüft, sollte die Entscheidung nicht allein auf die Annahme stützen, dass Größen, Seitenverhältnisse oder Referenzbilder großzügiger gehandhabt werden. Sinnvoller ist es, Bildqualität, Prompt-Treue, Geschwindigkeit, Kosten und API-Limits getrennt zu bewerten. Für API-Limits sollten offizielle Dokumentation und das tatsächliche Fehlerverhalten in Tests maßgeblich sein.[1][
17][
18][
21]
Praktisch bietet sich eine Testmatrix an: dieselben Prompts und Ausgangsbilder, aber systematisch variierte Größen, Seitenverhältnisse, Referenzbild-Anzahlen und Dateiformate. Pro Durchlauf sollten Erfolg, Ablehnung und Fehlermeldung dokumentiert werden. Erst wenn die offizielle Parametertabelle oder reproduzierbare Tests klare Unterschiede zeigen, sollte man öffentlich formulieren, GPT Image 2 unterstütze „mehr Größen“ oder habe „gelockerte Referenzbild-Limits“.
Die derzeit sicherste öffentliche Formulierung
Auf Basis der aktuell prüfbaren Quellen ist diese Aussage am belastbarsten: OpenAI führt Modellseiten für GPT Image 1.5 und GPT Image 2 sowie API-Endpunkte für Bilderzeugung und Bildbearbeitung. Die vorliegenden Auszüge enthalten jedoch keine vollständige offizielle Gegenüberstellung zu frei wählbaren Größen, Seitenverhältnissen oder Referenzbild-Eingaben. Daher lässt sich derzeit nicht belegen, dass GPT Image 2 gegenüber GPT Image 1.5 eine messbare Erweiterung der Parameterfreiheit bietet.[1][
13][
15][
17][
18][
21]




