Короткий ответ: надежного числа — например 2, 5 или 10 — в проверенных официальных материалах OpenAI нет. В Images API есть методы редактирования изображений, а Python-справочник OpenAI описывает входной параметр как The image(s) to edit15][
16][
17]
Что можно утверждать безопасно
Если вам нужно написать текст для интерфейса, документации или серверной валидации, самая аккуратная формулировка такая:
Сценарии GPT Image 2 Edit в принципе поддерживают множественный ввод изображений, но в проверенных официальных справках OpenAI не опубликован числовой максимум исходных изображений для одного запроса. [
15][
16][
17]
Ключевой момент — именно формулировка image(s) to edit16] Она не выглядит как ограничение «только одно изображение». Но это также не лимит. Превращать ее в обещание вроде «можно загрузить до 10 референсов» нельзя, если такой предел не указан в документации конкретного провайдера. [
16]
Входные изображения — не то же самое, что выходные
Путаница часто возникает из-за того, что в image API есть два разных счетчика:
- Исходные изображения — файлы или URL, которые вы передаете модели как референсы для редактирования.
- Сгенерированные изображения — результаты, которые модель возвращает после выполнения запроса.
Некоторые документы говорят о количестве изображений, которые нужно сгенерировать, а не о количестве изображений, которые можно загрузить на вход. Например, OpenAI-совместимая справка Zenlayer для image edit указывает, что «number of images to generate» должен быть от 1 до 10. Это настройка выходных изображений, а не лимит на число загружаемых референсов. [19]
Пример OpenVINO с OpenAI-совместимым endpoint показывает ту же разницу: в запрос отправляется один файл через image=@three_cats.png, а отдельно используется n=4, чтобы получить несколько результатов. Пример с одним входным файлом не доказывает, что входной файл может быть только один; и n=4 не означает, что принимаются четыре исходных изображения. [20]
Сторонние обертки не устанавливают официальный лимит OpenAI
Страницы провайдеров полезны для интеграции, но их нельзя автоматически считать официальными лимитами OpenAI — особенно если они не публикуют конкретное ограничение.
У Fal на странице openai/gpt-image-2/edit в примере запроса есть массив image_urls. Это согласуется с формой поля, рассчитанной на несколько изображений, но в самом показанном примере указан один URL и не опубликован максимум исходных изображений. [2]
WaveSpeedAI описывает сценарии GPT Image 2 Edit, где можно смешивать несколько референсов, но это описание провайдера, а не числовой официальный лимит OpenAI на входные изображения. [22]
Лимиты загрузки в ChatGPT — отдельная история
FAQ OpenAI по Image Inputs в ChatGPT говорит, что число изображений, которые пользователь может добавить в разговор, зависит от разных факторов, включая размер файлов. [7] Но это про поведение пользовательского интерфейса ChatGPT, а не про тот же самый лимит в Images API для edit-методов. Смешивать эти два случая опасно: можно заложить в код неверную валидацию. [
7][
15]
Для разработчика это практическая, а не теоретическая разница. Ограничение в ChatGPT, схема стороннего API-провайдера и прямой вызов OpenAI Images API могут отличаться. Проверять нужно ту систему, к которой реально идет запрос.
Что делать в продукте и коде
- Пишите осторожно. Формулировка «поддерживает несколько референсов» безопаснее, чем «загружайте до 10 исходных изображений», если ваш провайдер прямо не документирует такой лимит. [
16][
19]
- Разделяйте вход и выход. Храните отдельно число исходных изображений и параметры вроде
n, output count или «images to generate». [19][
20]
- Делайте лимиты настраиваемыми по провайдеру. Если вы вызываете Fal, WaveSpeedAI или другую обертку, ориентируйтесь на их схему, тестовые запросы и runtime-ошибки, а не на предполагаемый глобальный максимум OpenAI. [
2][
22]
- Показывайте честные ошибки пользователю. Если endpoint отклоняет слишком много референсов, сообщайте фактический лимит конкретного провайдера — без формулировки, будто это официальный максимум GPT Image 2 Edit.
Итог
На основании проверенных документов ответ сейчас не выражается одним числом. Официальные справки OpenAI по редактированию изображений используют формулировку image(s) to edit15][
16][
17]




