Отдельно важно, что документация OpenAI по генерации изображений делит задачи на два типа: Generations — создание изображения с нуля по текстовому prompt, и Edits — изменение уже существующего изображения. Для оценки точности это принципиально: «нарисовать сложную сцену по описанию» и «вставить или сдвинуть объект в готовой картинке» — разные тесты с разными типами ошибок.
В проверяемых выдержках OpenAI API changelog, Models и All models не видно официального количественного сравнения GPT Image 2 и GPT Image 1.5 по complex composition, spatial accuracy или multi-object placement. Поэтому строго подтверждённая часть выглядит так: GPT Image 1.5 документирован OpenAI как модель с улучшенным следованием промптам; утверждение «GPT Image 2 точнее на X% при расстановке объектов» этими источниками не подтверждается.
Проблема не в том, что о GPT Image 2 никто не пишет. Проблема в том, что публичные источники расходятся между собой.
Mew Design формулирует осторожно: GPT Image 2, по их оценке, выглядит как модель в тестировании, но не как официально публичная именованная модель OpenAI. getimg.ai также пишет, что OpenAI не объявляла GPT Image 2, а публичная линейка останавливается на
gpt-image-1.5.
При этом другой сторонний материал утверждает, что OpenAI 21 апреля 2026 года запустила ChatGPT Images 2.0 / gpt-image-2, и упоминает Arena score 1 512.
Есть и обзоры с практическими тестами. Например, RenovateQR пишет, что автор прогонял GPT Image 2 через стандартный набор промптов: продуктовая фотография, UI-макеты с плотными интерфейсными элементами, многоязычные вывески, портреты, брендированный контент и другие сценарии. Но в доступной выдержке нет воспроизводимой таблицы: сколько раз модель правильно выдержала левое/правое, передний/задний план, перекрытия, количество объектов и как это сравнивалось с GPT Image 1.5.
Более аккуратная формулировка поэтому такая: есть сторонние источники, которые говорят о GPT Image 2 как о тестируемой или уже запущенной модели, но по вопросу «насколько точнее она расставляет объекты в сложных сценах» открытых, официальных и воспроизводимых чисел пока недостаточно.
Один сторонний материал приводит общий счёт: GPT Image 2 — 1 512, GPT Image 1.5 — 1 241. Разница составляет 271 пункт. Это можно читать как сигнал, что некий источник ставит GPT Image 2 выше в общей оценке. Но это нельзя напрямую превратить в вывод «GPT Image 2 на 271 пункт лучше размещает объекты» или «точность расстановки выросла на определённый процент».
Причины простые:
Иными словами, в материале или презентации можно осторожно написать: «один сторонний источник приводит более высокий общий счёт для GPT Image 2». Нельзя писать: «OpenAI доказала, что GPT Image 2 точнее размещает объекты на X%».
Чтобы честно ответить, лучше ли GPT Image 2 справляется со сложной композицией, нужен не набор красивых примеров, а тестовая процедура. Минимум — такой:
Без таких условий единичный скриншот, пост в соцсетях или общий arena score не отвечают на вопрос «насколько точнее модель ставит объекты».
Пока нет официального или воспроизводимого внешнего benchmark, безопаснее не превращать «GPT Image 2, возможно, лучше» в числовое обещание. Практичный подход такой:
Самый сильный вывод, который выдерживают текущие источники: GPT Image 1.5 имеет официальную страницу OpenAI API и описан как модель с лучшим prompt adherence, а GPT Image 1 указан как предыдущая модель генерации изображений.
Но на вопрос «насколько GPT Image 2 точнее GPT Image 1.5 в сложной композиции и расстановке объектов» открытые проверяемые данные пока не дают числового ответа. Сторонние источники расходятся в описании статуса GPT Image 2, а баллы вроде 1 512 против 1 241 нельзя автоматически считать метрикой spatial accuracy или object-placement accuracy.
Comments
0 comments