Para equipos que integran edición de imágenes con IA, la tentación es buscar un número cerrado: “¿son 2, 5, 10 imágenes?”. Con la documentación revisada, la respuesta responsable es otra: no hay un máximo oficial documentado para cuántas imágenes fuente puede combinar una sola edición de GPT Image 2 Edit.
La API de Images de OpenAI incluye métodos de edición de imagen, y la referencia de Python describe la entrada como “The image(s) to edit”, es decir, “la imagen o imágenes que se van a editar”. Esa redacción admite la idea de entrada en plural, pero las referencias oficiales revisadas no publican un límite numérico de imágenes fuente por solicitud. [15][
16][
17]
La respuesta documentada, sin adornos
Si necesitas una frase segura para documentación, textos de producto o reglas de validación, esta es la más defendible:
Los flujos de GPT Image 2 Edit admiten entradas de imagen en plural en principio, pero las referencias oficiales de OpenAI revisadas no documentan un máximo numérico de imágenes fuente por petición. [
15][
16][
17]
El detalle clave está en la expresión “image(s) to edit” de la referencia de Python de OpenAI. [16] Es importante porque no presenta el parámetro como estrictamente limitado a una sola imagen. Pero tampoco equivale a un cupo publicado. Por eso no conviene convertirlo en una afirmación del tipo “permite hasta 10 imágenes fuente” si no hay otra fuente específica del proveedor que lo diga. [
16]
Entradas y salidas no son lo mismo
Buena parte de la confusión viene de mezclar dos conteos diferentes:
- Imágenes fuente: los archivos subidos o las URL de imágenes que sirven como referencias para la edición.
- Imágenes generadas: las imágenes que devuelve el modelo como resultado.
Algunas documentaciones hablan del número de imágenes que se van a generar, no del número de imágenes que se pueden subir como entrada. Por ejemplo, la referencia compatible con OpenAI de Zenlayer dice que el “número de imágenes a generar” debe estar entre 1 y 10; eso es un ajuste de salida, no un límite de subida de imágenes fuente. [19]
La documentación compatible con OpenAI de OpenVINO muestra la misma diferencia: en un ejemplo envía un archivo con image=@three_cats.png y, por separado, usa n=4 para solicitar varias salidas. Que un ejemplo use un solo archivo no demuestra que exista un máximo de un archivo, y n=4 no significa que se acepten cuatro imágenes fuente. [20]
Los wrappers de terceros no fijan el límite oficial
Las páginas de proveedores externos pueden ser útiles para implementar una integración, pero no deben tratarse como límites oficiales de OpenAI salvo que documenten explícitamente esa restricción.
La página de Fal para openai/gpt-image-2/edit muestra un campo image_urls con forma de arreglo en un ejemplo de petición, algo compatible con una estructura pensada para varias imágenes. El ejemplo mostrado incluye una sola URL y no publica un máximo de imágenes fuente. [2]
WaveSpeedAI describe flujos de GPT Image 2 Edit capaces de combinar múltiples referencias, pero esa es una descripción del proveedor, no un límite numérico oficial de OpenAI para imágenes fuente. [22]
El comportamiento de subida en ChatGPT es otro asunto
La FAQ de OpenAI sobre entradas de imagen en ChatGPT indica que el número de imágenes que una persona puede añadir a una conversación depende de varios factores, incluido el tamaño de las imágenes. [7] Esa FAQ trata del comportamiento de las conversaciones en ChatGPT, mientras que la referencia de la API de Images trata de métodos de edición de imagen; asumir que ambos límites son iguales puede llevar a validaciones incorrectas. [
7][
15]
Para quienes construyen productos, esta distinción es práctica. Un límite de la interfaz de ChatGPT, el esquema de un wrapper externo y la API de Images de OpenAI pueden imponer restricciones distintas. La validación debe hacerse contra el sistema que realmente se está llamando.
Recomendaciones para desarrolladores
- Sé preciso en el copy de producto. “Admite múltiples referencias” es más seguro que “sube hasta 10 imágenes fuente”, salvo que tu proveedor documente exactamente ese límite. [
16][
19]
- Separa parámetros de entrada y salida. Lleva por separado el conteo de imágenes fuente y valores como
n, el número de salidas o cualquier parámetro de “imágenes a generar”. [19][
20]
- Haz configurables los límites por proveedor. Si llamas a Fal, WaveSpeedAI u otro wrapper, prueba su esquema y sus errores en tiempo de ejecución en lugar de asumir un máximo global de OpenAI. [
2][
22]
- Muestra errores claros al usuario. Si un endpoint rechaza demasiadas referencias, informa el límite efectivo de ese proveedor sin presentarlo como si fuera el máximo oficial de GPT Image 2 Edit.
En resumen
Con la documentación revisada, la respuesta no es un número. Las referencias de edición de imagen de OpenAI admiten entrada en plural mediante la frase “image(s) to edit”, pero no documentan un máximo de imágenes fuente para una sola solicitud de edición. [15][
16][
17]




