用 GPT Image 2 執人像、商品相或者社交圖,真正令人擔心嘅往往唔係「識唔識改」,而係「可唔可以只改我圈住嗰小部分,其他全部唔郁」。按目前可核實資料,答案要講得保守:OpenAI API 文件列出 GPT Image 2 呢個模型;GPT Image 官方範例亦有 mask(遮罩)局部編修流程,但資料唔支持「像素級保證只改遮罩範圍」呢種講法。[2][
15]
先講結論:mask 係提示方向,唔係鎖死圖層
OpenAI API 文件有「GPT Image 2 Model」頁面,足以確認 GPT Image 2 係 OpenAI 文件列出嘅模型。[2] 不過,講到遮罩點樣運作,最直接嘅官方說明係 OpenAI Developers 嘅 GPT Image 範例:用戶可以提供 mask,令模型避免改動輸入圖片入面某啲指定部分;使用 mask 時仍然要配合 prompt。[
15]
重點係「避免」,唔係「絕對唔改」。OpenAI 同一份範例明確提醒,即使用咗 mask,模型仍可能修改到遮罩入面部分內容;如果需要 exact mask,官方建議使用影像分割模型。[15] 換句話講,mask 比較似「請盡量唔好郁呢度」,唔係傳統修圖軟件入面嗰種像素級硬鎖。[
15]
官方資料到底確認咗啲乜
目前官方資料可以支持三點:
- GPT Image 2 確實出現在 OpenAI API 模型文件。 但呢一點只係確認模型存在於文件入面,唔等於保證每次修圖都能穩定保留人臉、光線、構圖或者未指定區域。[
2][
15]
- GPT Image 有官方 mask 編修流程。 文件寫明,如果唔想模型改動輸入圖片某個部分,可以提供 mask;但 mask 仍要同文字 prompt 一齊引導輸出。[
15]
- 官方冇將 mask 描述成像素級保證。 相反,官方提醒模型仍可能改到 mask 入面部分內容,精準遮罩需求應配合影像分割模型。[
15]
放喺人像同商品相,風險喺邊?
如果你嘅要求係「只執走衫上一粒污漬,但塊面、膚色、光線、背景同構圖比例全部完全一樣」,現有官方資料不足以支持呢種保證。[2][
15] mask 可以幫你收窄修改方向、降低唔想改嘅位置被帶動嘅機會;但官方用語係模型會 avoid,而唔係 never change。[
15]
所以,高敏感素材要特別小心。人臉、商品輪廓、品牌 logo、包裝文字、證件相,以及需要保持同一光線嘅商業圖片,都唔應該只睇生成結果「似唔似自然」。較穩陣做法係保留原圖,逐張前後對照,檢查面部細節、邊緣、文字、比例同構圖有冇被一齊改咗;呢個係因應官方 mask 限制而做嘅基本風險控制。[15]
開發者社群回報可以點參考
OpenAI Developer Community 有多則同 gpt-image-1 有關嘅遮罩編修回報,內容包括 mask edits 保留效果唔理想、mask 未能將修改限制喺指定範圍、inpainting with a mask 取代整張圖片,以及 mask 被忽略等問題。[3][
4][
9][
10]
其中一則社群回覆將 GPT Image 嘅 masking 形容為 prompt-based,並指模型會重新生成整張圖,只係盡量令未修改區接近原圖;該回覆亦提到模型未必會完全精準跟足 mask 形狀。[6]
要講清楚:呢啲主要係 gpt-image-1 嘅社群回報,唔係 OpenAI 對 GPT Image 2 嘅正式性能承諾,所以唔可以直接推論「GPT Image 2 一定都有同一問題」。[3][
4][
6][
9][
10] 但佢哋同官方 cookbook 對「mask 未必完全精準」嘅提醒方向一致,足以作為實務使用時嘅風險訊號。[
15]
第三方話「像素級手術式修改」,要點睇?
有第三方網站將「GPT Image 2 Edit」描述為可以用自然語言修改參考圖,並宣稱能做到「surgical pixel-level edits」,甚至唔需要 masks、layers 或 Photoshop。[5] 呢類說法可以理解為產品宣傳;但如果你要判斷係咪真係可以「只改一小忽,其他完全不變」,應優先睇 OpenAI 官方文件入面嘅限制說明,再加上自己用實際素材測試。[
15]
目前較穩妥嘅說法係:GPT Image 相關編修可以用 mask 做局部導向;但官方資料唔支持將 mask 當成保證未指定區域完全不變嘅工具。[15]
實務建議:幾時可以試,幾時要收緊驗收
如果你係做概念稿、社交圖變體、背景方向探索,或者快速試視覺風格,mask 編修值得測試;OpenAI 官方確實提供咗遮罩式編修例子。[15]
但如果係人像精修、商品主圖、證件相、品牌素材,或者圖入面有重要文字,驗收就要嚴格啲:
- prompt 要講清楚。 使用 mask 時仍然需要 prompt,所以要清楚寫明要改邊度、哪些元素要保留。[
15]
- 需要準確邊界,就唔好靠手感 mask。 OpenAI 建議需要 exact mask 時,可以使用影像分割模型。[
15]
- 將輸出當候選稿,唔好即刻當終稿。 官方已提醒 mask 仍可能令遮罩內部分被改動,所以人臉、商品邊位、文字同品牌元素都要人手檢查。[
15]
- 保留原圖做前後比對。 對構圖比例、光線一致性同關鍵細節敏感嘅圖片,應逐張比對,而唔係只憑生成圖睇落自然就收貨。[
15]
最穩陣嘅一句
GPT Image 2 可以放入局部修圖流程入面測試,但目前可核實資料唔支持「一定只改指定小區域,人物臉、光線同構圖完全唔受影響」呢種保證。OpenAI 官方範例支持用 mask 做局部導向,同時亦提醒 mask 可能唔完全精準;高精度修圖應配合影像分割、前後比對同人手驗收。[2][
15]




