즉, 편집은 단순히 프롬프트를 잘 써서 새 이미지를 비슷하게 만드는 요령이 아니라, 기존 시각 입력을 출발점으로 삼는 별도 작업 흐름입니다. OpenAI의 이미지 레퍼런스 역시 “프롬프트 및/또는 입력 이미지”를 바탕으로 새 이미지를 생성할 수 있다고 설명해, 텍스트만이 아니라 입력 이미지를 쓰는 흐름을 뒷받침합니다.
GPT Image 2 자체에 대한 더 직접적인 예시는 통합 서비스 문서에서 확인됩니다. Replicate는 GPT Image 2가 텍스트로 이미지를 만들거나 기존 이미지를 편집할 수 있다고 설명하고, fal.ai는 openai/gpt-image-2/edit 엔드포인트 예시에서 prompt와 image_urls를 함께 사용합니다.
확인된 OpenAI 자료에서 가장 확실한 부분은 “이미지 생성”과 “이미지 편집”이 별도 작업이라는 점입니다. 또한 OpenAI의 편집 API 레퍼런스 일부는 GPT 이미지 모델군의 기본 반환 동작을 언급해, 편집 메서드가 GPT 이미지 모델 계열과 연결되어 있음을 보여 줍니다.
다만 이 자료만으로 GPT Image 2의 모든 요청 필드, 제한, 계정별 사용 가능 여부까지 확정할 수는 없습니다. 개발자가 실제 서비스에 넣을 때는 현재 OpenAI의 GPT Image 2 모델 페이지와 이미지 편집 API 레퍼런스를 다시 확인해야 합니다.
개발 문서에서 가장 안전한 표현은 **입력 이미지(input image)**입니다. “업로드 이미지”라고 하면 파일을 직접 전송하는 방식만 떠올릴 수 있지만, 실제 통합 방식은 서비스마다 다를 수 있습니다.
예를 들어 fal.ai의 GPT Image 2 편집 예시는 image_urls 배열에 이미지 URL을 넣는 형태입니다. 반면 OpenAI 레퍼런스의 표현은 더 넓습니다. 프롬프트 및/또는 입력 이미지를 바탕으로 새 이미지를 생성한다고 설명합니다.
따라서 fal.ai의 image_urls 같은 래퍼 파라미터를 OpenAI 네이티브 API의 범용 파라미터명으로 그대로 가정해서는 안 됩니다. 프로덕션 구현 전에는 직접 쓰려는 API의 현재 엔드포인트, 요청 필드, 파일 또는 URL 입력 방식, 모델 사용 가능 여부를 확인하는 편이 안전합니다.
OpenAI의 GPT Image 관련 쿡북은 입력 이미지에서 특정 부분을 바꾸고 싶지 않을 때 마스크를 제공할 수 있다고 설명합니다. 예를 들어 배경만 바꾸고 인물은 유지하고 싶을 때 마스크가 유용할 수 있습니다.
하지만 마스크를 “절대 수정 금지 영역”으로 이해하면 곤란합니다. 같은 문서는 모델이 마스크 안쪽 일부도 여전히 편집할 수 있으며, 정확한 마스크가 필요하다면 이미지 세그멘테이션 모델 사용을 권합니다.
image_urls는 해당 통합에서 확인된 입력 방식이지, 모든 OpenAI 직접 호출에서 같은 이름으로 쓰인다고 단정하면 안 됩니다.GPT Image 2는 텍스트로 새 이미지만 만드는 모델로 한정되지 않습니다. 확인된 자료 기준으로, 입력 이미지를 바탕으로 편집하는 워크플로가 지원된다고 보는 것이 맞습니다. 다만 가장 강한 일반 근거는 OpenAI의 이미지 편집 및 입력 이미지 워크플로 문서이고, GPT Image 2에 특화된 편집 예시는 Replicate와 fal.ai 쪽에서 더 구체적으로 확인됩니다.
Comments
0 comments