인물 사진에서 옷의 작은 얼룩만 지우고 싶거나, 상품 사진에서 배경의 작은 물체만 없애고 싶을 때 핵심은 단순히 “편집이 되느냐”가 아닙니다. 더 중요한 질문은 “내가 지정한 그 부분만 바뀌고, 얼굴·피부톤·조명·구도·문구는 정말 그대로 남느냐”입니다.
현재 확인 가능한 답은 신중해야 합니다. OpenAI API 문서에는 GPT Image 2 모델 페이지가 존재한다는 점은 확인됩니다.[2] 또 OpenAI의 GPT Image 예제 문서는 mask를 이용한 부분 편집 흐름을 설명합니다.[
15] 하지만 그 자료만으로 “mask를 치면 지정한 작은 영역만 바뀌고 나머지 픽셀은 완전히 고정된다”고 말할 수는 없습니다.[
15]
결론부터: mask는 방향을 잡아주는 도구이지, 하드 락이 아니다
OpenAI Developers의 GPT Image 예제는 사용자가 입력 이미지의 특정 부분을 바꾸고 싶지 않을 때 mask를 제공할 수 있다고 설명합니다.[15] 즉, GPT Image 계열 편집에서 mask가 부분 편집을 유도하는 장치로 쓰인다는 점은 공식 자료로 확인됩니다.
다만 같은 문서는 중요한 단서를 붙입니다. mask를 사용하더라도 모델이 mask 안의 일부를 여전히 수정할 수 있으며, 다만 이를 피하려고 한다는 취지로 안내합니다. 정확한 mask가 필요하다면 이미지 분할 모델을 함께 쓰라는 권고도 제시합니다.[15]
따라서 가장 안전한 표현은 이렇습니다. GPT Image 관련 도구는 mask로 국소 편집을 유도할 수 있지만, mask가 포토샵의 잠금 레이어처럼 나머지 픽셀을 절대 건드리지 않는다고 보장하지는 않습니다.[15]
공식 문서가 실제로 확인해 주는 것
공식 자료로 확인되는 내용은 크게 세 가지입니다.
첫째, GPT Image 2는 OpenAI API의 모델 문서에 올라와 있습니다.[2] 이는 GPT Image 2가 OpenAI 문서에 등재된 모델이라는 사실을 뒷받침합니다. 그러나 이 사실만으로 모든 사진 편집에서 인물 얼굴, 조명, 구도, 미지정 영역이 안정적으로 보존된다고 결론낼 수는 없습니다.[
2][
15]
둘째, OpenAI의 GPT Image 예제에는 mask 편집 흐름이 있습니다. 문서는 입력 이미지의 특정 부분을 모델이 바꾸지 않기를 원할 때 mask를 제공할 수 있다고 설명하며, mask를 사용할 때도 prompt가 필요하다고 안내합니다.[15] 다시 말해 결과는 mask만으로 결정되는 것이 아니라, 텍스트 지시와 함께 모델이 해석하는 방식에 영향을 받습니다.[
15]
셋째, OpenAI는 mask를 픽셀 단위 보장으로 설명하지 않습니다. 오히려 mask를 써도 모델이 일부 영역을 수정할 수 있다고 밝히고, 정밀한 mask가 필요하면 이미지 분할 모델을 쓰라고 권합니다.[15]
얼굴, 조명, 구도에는 어떤 의미인가
요구사항이 “옷의 얼룩 하나만 지우되 얼굴, 피부색, 조명, 배경 구도는 완전히 그대로”라면, 현재 제공된 공식 자료만으로 그런 보장을 뒷받침하기는 어렵습니다.[2][
15] mask는 원치 않는 변경이 일어날 가능성을 낮추는 데 도움을 줄 수 있지만, 공식 표현의 핵심은 “피한다”이지 “절대 바꾸지 않는다”가 아닙니다.[
15]
특히 민감한 이미지에서는 이 차이가 큽니다. 인물 얼굴, 상품 외곽선, 브랜드 로고, 포장지의 글자, 증명사진, 조명 일관성이 중요한 상업용 이미지는 생성 결과가 겉보기에 자연스럽다는 이유만으로 통과시키기 어렵습니다. 원본을 보관하고, 결과물을 한 장씩 대조하면서 얼굴의 세부 형태, 경계선, 글자, 로고, 구도 비율이 함께 흔들리지 않았는지 확인하는 절차가 필요합니다.[15]
개발자 커뮤니티 사례는 참고 신호로 봐야 한다
OpenAI Developer Community에는 gpt-image-1과 관련해 mask 편집이 기대대로 보존되지 않았다는 보고가 여럿 있습니다. 주제에는 mask edits 보존 문제, mask가 편집 범위를 특정 영역으로 제한하지 못했다는 내용, mask를 사용한 inpainting이 전체 이미지를 대체했다는 보고, mask가 무시됐다는 문제 제기 등이 포함됩니다.[3][
4][
9][
10]
한 커뮤니티 답변은 GPT Image의 masking을 prompt-based로 설명하면서, 모델이 전체 이미지를 다시 생성하되 수정하지 않은 영역을 원본과 최대한 비슷하게 그리려 한다고 말합니다. 또한 mask의 정확한 형태를 완전한 정밀도로 따르지 않을 수 있다고도 설명합니다.[6]
다만 이 커뮤니티 사례들은 주로 gpt-image-1을 다루며, GPT Image 2에 대한 OpenAI의 공식 성능 약속은 아닙니다.[3][
4][
6][
9][
10] 그러므로 “GPT Image 2도 반드시 같은 문제가 있다”고 단정해서는 안 됩니다. 그렇지만 공식 예제 문서가 밝힌 mask의 한계와 같은 방향을 가리키는 실무상 위험 신호로는 볼 수 있습니다.[
15]
“픽셀 단위 수술식 편집”이라는 홍보 문구는 어떻게 볼까
일부 제3자 사이트는 “GPT Image 2 Edit”를 자연어 지시만으로 참조 이미지를 수정하는 도구로 소개하며, “surgical pixel-level edits”, 즉 수술처럼 정밀한 픽셀 단위 편집이 가능하고 mask, layer, Photoshop이 필요 없다고 홍보합니다.[5]
이런 문구는 시장 홍보 자료로 참고할 수는 있습니다. 그러나 실제로 “사진의 아주 작은 부분만 바꾸고 나머지는 완전히 동일하게 유지되는가”를 판단할 때는 OpenAI 공식 문서의 제한 설명과 직접 테스트 결과를 우선해야 합니다.[15]
현재 공식 자료가 지지하는 주장은 “GPT Image 편집에서 mask로 부분 수정을 유도할 수 있다”는 것입니다. 반대로 공식 자료가 지지하지 않는 주장은 “mask가 지정하지 않은 영역을 완전히 불변으로 보장한다”는 것입니다.[15]
실무 체크리스트: 어디까지 맡기고, 어디서 멈출까
개념 시안, 소셜 이미지 변형, 배경 교체 방향 탐색, 빠른 비주얼 실험이라면 mask 편집은 충분히 테스트해볼 만합니다. OpenAI가 mask를 이용한 편집 예제를 제공하기 때문입니다.[15]
반대로 고정밀 인물 사진, 상품 대표 이미지, 증명사진, 브랜드 소재, 중요한 문구가 포함된 이미지는 검수 기준을 높여야 합니다.
- prompt를 구체적으로 쓴다. mask를 쓰더라도 prompt가 필요하므로, 무엇을 바꾸고 무엇을 보존할지 명확히 적어야 합니다.[
15]
- 정확한 경계가 필요하면 mask 준비를 강화한다. OpenAI는 exact mask가 필요할 경우 이미지 분할 모델을 사용할 수 있다고 안내합니다.[
15]
- 결과물을 후보안으로 본다. 공식 문서가 mask 안의 일부도 수정될 수 있다고 안내하는 만큼, 얼굴·제품 경계·문자·브랜드 요소는 사람이 확인해야 합니다.[
15]
- 원본과 전후 비교를 한다. 구도 비율, 조명 일관성, 핵심 디테일이 중요한 이미지는 생성본만 보지 말고 원본과 나란히 비교하는 절차가 필요합니다.[
15]
가장 안전한 한 줄 요약
GPT Image 2는 부분 편집 워크플로에 넣어 시험해볼 수 있습니다. 그러나 현재 확인 가능한 자료는 “지정한 작은 영역만 반드시 바뀌고, 인물 얼굴·조명·구도는 완전히 보존된다”는 보장을 뒷받침하지 않습니다. OpenAI 공식 예제는 mask 기반 국소 편집을 지원하면서도, mask가 완전히 정밀하지 않을 수 있음을 함께 안내합니다. 고정밀 편집에는 이미지 분할, 원본 대조, 사람의 최종 검수가 필요합니다.[2][
15]




