Документация Images API описывает size как размер создаваемого изображения . В той же группе полей упоминаются настройки
background, output_format, quality и информация об использовании токенов для GPT image models .
Самое конкретное значение размера в предоставленных материалах — пример ответа Create image editoutput_format = png, quality = low и size = 1024x1024 .
Это подтверждает, что 1024x1024 встречается в примере документации. Но из этого не следует, что GPT Image 2 поддерживает только 1024x1024, а также не следует конкретный набор форматов — например квадратный, горизонтальный, вертикальный или 4K. Более точная формулировка такая: OpenAI Images API имеет поле size; пример image edit показывает 1024x1024; предоставленные источники не раскрывают полный список допустимых значений size именно для GPT Image 2 .
Практический вывод для разработчиков простой: не превращайте один пример из API reference в жёсткий enum поддерживаемых размеров в продукте.
У OpenAI есть API-справочник для операции редактирования изображения через Create image edit. OpenAI Cookbook — раздел с практическими примерами для разработчиков — также описывает сценарий с mask: пользователь может передать маску, если не хочет, чтобы модель меняла определённую часть входного изображения
.
Важно: mask не стоит понимать как абсолютную защиту пикселей. Cookbook предупреждает, что модель всё равно может изменить некоторые части внутри области mask, хотя будет стараться этого избегать; если нужна точная маска, OpenAI предлагает использовать модель сегментации .
Из текущих источников можно подтвердить три вещи:
А вот для полноценной технической спецификации этого мало. Предоставленные источники не позволяют уверенно назвать допустимые форматы входных изображений, максимальный размер файла, максимальное разрешение, число входных изображений на один запрос или отдельные требования к alpha channel именно для GPT Image 2 .
У некоторых сторонних платформ есть собственные страницы для GPT Image 2. Runware описывает GPT Image 2 как универсальную модель семейства GPT Image для text-to-image generation и image editing . Fal.ai также имеет страницу GPT Image 2.0 с playground, API и собственной schema
.
Эти страницы полезны, если вы вызываете GPT Image 2 через инфраструктуру конкретного провайдера. Но если вы работаете с OpenAI напрямую, важно разделять два уровня: официальную документацию OpenAI API и схему промежуточного провайдера. Enum размеров или лимит файла в схеме Runware или Fal.ai не становится автоматически официальным параметром OpenAI API .
1024x1024. Это значение есть в примере image edit, но предоставленные источники не показывают полный список размеров для GPT Image 2 Короткий ответ: GPT Image 2 присутствует в документации OpenAI API ; в OpenAI Images API есть поле
size для создаваемого изображения ; пример
Create image edit1024x1024 . Но по предоставленным источникам нельзя официально опубликовать полный список поддерживаемых размеров или полный набор ограничений для входных изображений именно GPT Image 2.
Comments
0 comments