把 GPT Image 2 拿來修人物照、商品照或社群圖時,關鍵問題通常不是「能不能改圖」,而是「能不能只改指定一小塊,其他地方完全不動」。目前可查核的答案要保守:官方資料支持 GPT Image 具備 mask 局部編修流程,但不支持「像素級保證只改遮罩區」這種強說法。[2][
15]
先給結論:mask 是引導,不是硬鎖定
OpenAI API 文件中有「GPT Image 2 Model」頁面,這能確認 GPT Image 2 是 OpenAI 文件列出的模型。[2] 但在可查核的官方資料中,真正說明遮罩工作流的是 OpenAI Developers 的 GPT Image 範例:使用者可以提供 mask,讓模型避免改動輸入圖片中的特定部分。[
15]
限制也在同一份官方範例裡。OpenAI 明確提醒,即使用了 mask,模型仍可能修改到遮罩中的部分區域,只是會避免這麼做;如果需要 exact mask,官方建議搭配影像分割模型。[15] 因此,最穩妥的判斷是:GPT Image 相關工具可以用 mask 引導局部修改,但不能把 mask 當成保證其他像素完全不變的鎖定層。[
15]
官方文件實際確認了什麼
官方資料目前能支持三件事。
第一,GPT Image 2 確實出現在 OpenAI API 的模型文件中。[2] 這能支持「GPT Image 2 是 OpenAI 文件中的模型」這個說法,但不能單獨推出它在每次照片編修中都會穩定保留人物臉、光線、構圖或未指定區域。[
2][
15]
第二,GPT Image 的官方範例有 mask 編修流程。文件寫明,如果不希望模型改動輸入圖片的特定部分,可以提供 mask;使用 mask 時仍然需要 prompt,代表遮罩與文字指令是一起引導輸出的。[15]
第三,官方沒有把 mask 描述成像素級保證。相反地,文件提醒模型仍可能改到 mask 中的部分內容,並建議在需要精準遮罩時使用影像分割模型。[15]
對人物臉、光線與構圖代表什麼
如果你的需求是「只修衣服上一個小污點,但臉、膚色、光線、背景構圖都完全不變」,目前提供的官方資料不足以支持這種保證。[2][
15] mask 可以降低不想修改區域被動到的機率,但官方說法本身就是「會避免」,不是「絕不更動」。[
15]
這對高敏感素材尤其重要。人物臉、商品輪廓、品牌標誌、包裝文字、證件照與需要一致光線的商業圖片,都不應只看生成結果是否大致好看;更安全的流程是保留原圖,逐張對照檢查臉部細節、邊緣、文字與構圖比例是否被帶動改變。這是對官方 mask 限制的必要風險控管。[15]
社群回報能說明什麼,不能說明什麼
OpenAI Developer Community 中有多則與 gpt-image-1 相關的遮罩編修回報,主題包括 mask edits 保留不佳、mask 無法把修改限制在特定區域、inpainting with a mask 取代整張圖片,以及 mask 被忽略等問題。[3][
4][
9][
10]
其中一則社群回覆把 GPT Image 的 masking 描述為 prompt-based,並稱模型會重新生成整張圖,只是盡量把未修改區畫得接近原圖;該回覆也指出模型可能不會完全精準遵守 mask 形狀。[6]
這些社群內容主要指向 gpt-image-1,也不是 OpenAI 對 GPT Image 2 的正式性能承諾,所以不能直接得出「GPT Image 2 一定有同樣問題」的結論。[3][
4][
6][
9][
10] 但它們和官方 cookbook 對 mask 可能不完全精準的提醒方向一致,足以作為實務使用時的風險訊號。[
15]
第三方「像素級手術式修改」宣傳要怎麼看
有第三方網站把「GPT Image 2 Edit」描述為可用自然語言修改參考圖,並宣稱能做「surgical pixel-level edits」、不需要 masks、layers 或 Photoshop。[5] 這類說法可以當作市場宣傳參考,但在判斷是否能「只改一小塊、其他完全不變」時,應優先以 OpenAI 文件中的限制說明與自己的測試結果為準。[
15]
換句話說,目前官方資料能支持的是:GPT Image 相關編修可用 mask 做局部導向;官方資料不能支持的是:mask 能保證未指定區域完全不被模型改動。[15]
實務建議:哪些情境適合,哪些要小心
如果目標是快速產生概念稿、社群圖變體、背景替換方向或視覺探索,mask 編修值得測試,因為 OpenAI 的確提供了遮罩式編修範例。[15]
但如果目標是高精度人物照、商品主圖、證件照、品牌素材或含有重要文字的圖片,驗收標準應該更嚴格:
- prompt 要明確。 使用 mask 時仍需要 prompt,因此要清楚描述要改什麼、哪些地方要保留。[
15]
- 需要精準邊界時,先做好 mask。 OpenAI 建議,如果需要 exact mask,可以使用影像分割模型。[
15]
- 把輸出當候選稿,不要直接當終稿。 官方已提醒 mask 仍可能被部分改動,因此臉部、產品邊緣、文字與品牌元素都應人工檢查。[
15]
- 保留原圖並做前後比對。 對構圖比例、光線一致性與關鍵細節敏感的圖片,最好逐張比較,而不是只看生成圖是否自然;這是因應 mask 不保證完全不變的必要流程。[
15]
最安全的一句話
GPT Image 2 可以放進局部改圖工作流中測試,但目前可查核資料不支持「一定只改指定小區域,人物臉、光線與構圖完全不受影響」的保證說法。OpenAI 官方範例支持 mask 局部導向,也同時提醒 mask 仍可能不完全精準;高精度修圖應搭配影像分割、前後比對與人工驗收。[2][
15]




