Wer GPT Image 2 Edit in ein Produkt einbaut, sucht oft nach einer einfachen Zahl: 2, 5, 10? Genau diese Zahl lässt sich aus den geprüften offiziellen OpenAI-Referenzen aber nicht sauber ableiten. OpenAI dokumentiert Bildbearbeitungs-Methoden in der Images API; die Python-Referenz beschreibt den Edit-Input als „The image(s) to edit“. Ein offizielles numerisches Maximum für Quellbilder pro Edit-Anfrage nennen die geprüften OpenAI-Referenzen jedoch nicht. [15][
16][
17]
Die belastbare Kurzantwort
Für Produkttexte, technische Dokumentation oder Validierungsregeln ist die vorsichtige Formulierung:
GPT-Image-2-Edit-Workflows unterstützen grundsätzlich plural formulierte Bildeingaben, aber die geprüften offiziellen OpenAI-Referenzen dokumentieren kein numerisches Maximum für Quellbilder pro Edit-Anfrage. [
15][
16][
17]
Der entscheidende Ausdruck ist OpenAIs Formulierung „image(s) to edit“ in der Python-API-Referenz. [16] Sie spricht nicht für ein strikt einzelnes Eingabebild. Gleichzeitig ist sie aber keine veröffentlichte Obergrenze. Ohne eine weitere, konkrete Anbieterquelle sollte daraus also nicht „bis zu 10 Quellbilder“ oder eine andere feste Zahl gemacht werden. [
16]
Eingabebilder sind nicht dasselbe wie Ausgabebilder
Viele Missverständnisse entstehen, weil bei Bild-APIs zwei verschiedene Zählweisen zusammenkommen:
- Quell- oder Eingabebilder: Dateien oder Bild-URLs, die als Referenz für die Bearbeitung dienen.
- Generierte Ausgabebilder: Bilder, die das Modell als Ergebnis zurückliefert.
Manche Dokumentationen sprechen über die Anzahl der zu generierenden Bilder, nicht über die Anzahl der hochladbaren Referenzbilder. Die OpenAI-kompatible Image-Edit-Referenz von Zenlayer nennt zum Beispiel eine Spanne von 1 bis 10 für die „number of images to generate“. Das ist eine Output-Einstellung, keine Upload-Grenze für Quellbilder. [19]
Auch das OpenAI-kompatible Image-Edit-Beispiel von OpenVINO zeigt diese Trennung: Dort wird eine Datei mit image=@three_cats.png gesendet und separat mit n=4 mehrere Outputs angefordert. Ein Beispiel mit einer Quelldatei beweist keine Ein-Datei-Grenze, und n=4 bedeutet nicht, dass vier Quellbilder akzeptiert werden. [20]
Drittanbieter-Wrapper klären das offizielle Limit nicht
Drittanbieter-Seiten können für die konkrete Implementierung hilfreich sein. Sie sollten aber nicht als offizielle OpenAI-Grenzen gelesen werden, wenn sie keine entsprechende Beschränkung ausdrücklich dokumentieren.
Die Seite von Fal zu openai/gpt-image-2/edit zeigt in einem Beispiel-Request ein Feld image_urls als Array. Das passt zu einem Datenformat, das mehrere Bilder aufnehmen kann; das gezeigte Beispiel enthält jedoch nur eine URL und veröffentlicht kein Maximum für Quellbilder. [2]
WaveSpeedAI beschreibt GPT-Image-2-Edit-Workflows, die mehrere Referenzen kombinieren können. Auch das ist eine Anbieterbeschreibung, aber keine numerische OpenAI-Grenze für Quellbilder. [22]
ChatGPT-Uploads sind ein anderes Thema als die Images API
OpenAIs FAQ zu Bildeingaben in ChatGPT sagt, dass die Anzahl der Bilder, die Nutzerinnen und Nutzer zu einer ChatGPT-Unterhaltung hinzufügen können, von mehreren Faktoren abhängt, darunter die Bildgröße. [7] Diese FAQ betrifft das Verhalten der ChatGPT-Oberfläche beziehungsweise Konversationen; die Images-API-Referenz betrifft dagegen Bildbearbeitungs-Methoden. Beides gleichzusetzen kann zu falscher Validierungslogik führen. [
7][
15]
Für Entwicklerinnen und Entwickler heißt das: Ein Limit in der ChatGPT-Oberfläche, ein Schema eines Drittanbieter-Wrappers und die OpenAI Images API können in der Praxis unterschiedliche Grenzen haben. Entscheidend ist der Endpoint, den die eigene Anwendung tatsächlich aufruft.
Praktische Empfehlungen für die Implementierung
- Produkttexte präzise halten. „Unterstützt mehrere Referenzen“ ist sicherer als „bis zu 10 Quellbilder hochladen“, solange der genutzte Anbieter genau diese Grenze nicht dokumentiert. [
16][
19]
- Input und Output getrennt zählen. Die Zahl der Quellbilder sollte getrennt von
n, der Output-Anzahl oder einer „images to generate“-Einstellung behandelt werden. [19][
20]
- Limits pro Anbieter konfigurierbar machen. Wer Fal, WaveSpeedAI oder einen anderen Wrapper nutzt, sollte dessen Schema und Laufzeitfehler testen, statt ein globales OpenAI-Maximum anzunehmen. [
2][
22]
- Fehlermeldungen sauber formulieren. Wenn ein Endpoint zu viele Referenzen ablehnt, sollte die Anwendung das effektiv beobachtete Anbieterlimit melden — ohne es als offizielles GPT-Image-2-Edit-Maximum auszugeben.
Fazit
Die derzeit belegbare Antwort ist keine Zahl. OpenAIs Bildbearbeitungs-Referenzen unterstützen durch die Formulierung „image(s) to edit“ zwar plural gedachte Bildeingaben, dokumentieren aber kein maximales Quellbild-Kontingent für eine einzelne Edit-Anfrage. [15][
16][
17]




