公開されている公式資料から、少なくとも次の3点は確認できます。
1つ目は、OpenAI APIのドキュメントに「GPT Image 2 Model」のページがあることです。 これはGPT Image 2というモデルがOpenAIのAPI資料に掲載されていることを示します。ただし、それだけで、写真編集時に人物の顔、肌の色、照明、構図、未指定領域が毎回安定して保持されるとまでは言えません。
2つ目は、GPT Imageの公式サンプルにマスクを使った編集手順があることです。資料では、入力画像の特定部分を変えたくない場合にマスクを提供できると説明されています。また、マスクを使う場合でもプロンプトは必要です。つまり、マスクとテキスト指示を組み合わせて出力を誘導する仕組みです。
3つ目は、OpenAIがマスクを「完全なピクセル固定」とは説明していないことです。むしろ公式サンプルは、マスク内の一部が編集される可能性があると注意し、正確なマスクが必要なら画像セグメンテーションモデルを使うよう示しています。
特に注意したいのは、次のような素材です。
これらでは、生成結果が一見きれいでも、元画像と細部が変わっていないかを確認する必要があります。顔の輪郭、目元、商品エッジ、文字、ロゴ、背景の比率などは、出力後に必ず原本と見比べるべきです。これは、マスクが完全な固定機能ではないという公式上の注意に対応するためのリスク管理です。
OpenAI Developer Communityには、gpt-image-1のマスク編集に関する複数の報告があります。内容は、マスク編集で元画像の保持がうまくいかない、マスクが編集範囲を十分に制限しない、マスク付きのinpaintingで画像全体が置き換わったように見える、マスクが無視される、といったものです。
また、あるコミュニティ返信では、GPT Imageのマスキングはプロンプトベースであり、モデルは画像全体を再生成しつつ、未変更領域をできるだけ元に近く描き直そうとする、という趣旨の説明がされています。その返信では、マスク形状に完全な精度で従わない可能性にも触れています。
ただし、ここは切り分けが必要です。これらは主にgpt-image-1に関するコミュニティ上の報告であり、GPT Image 2の公式な性能保証ではありません。 そのため、「GPT Image 2も必ず同じ問題を起こす」と断定する材料にはなりません。
第三者サイトの中には、「GPT Image 2 Edit」を、自然言語だけで参照画像を編集できるモデルとして紹介し、「surgical pixel-level edits」や、マスク、レイヤー、Photoshop不要といった強い表現で宣伝している例があります。
こうした文言は、サービス紹介やマーケティング表現として読むことはできます。しかし、「本当に一部だけ変えて、他は完全に変えないのか」を判断する根拠としては、OpenAIの公式資料にある制限説明と、自分の用途での検証結果を優先すべきです。
マスク編集は、ラフ案や方向性の検討には十分に試す価値があります。たとえば、SNS画像のバリエーション作成、背景差し替えの案出し、ビジュアルコンセプトの探索などです。OpenAIの公式サンプルにも、マスクを使った画像編集の手順は示されています。
一方で、以下のような用途では、AIの出力をそのまま最終版にしない方が安全です。
チェックのポイントは4つあります。
GPT Image 2は、局部編集のワークフローに組み込んで試すことはできます。OpenAIの資料ではGPT Image 2のモデルページが確認でき、GPT Imageの公式サンプルではマスクを使った編集手順も示されています。
ただし、現在確認できる資料は、「指定した小さな範囲だけを必ず変更し、人物の顔、光、構図、背景は完全に不変」といった保証までは支えていません。マスクは編集を誘導する有用な手段ですが、ピクセル単位の完全なロックではありません。精度が必要な画像では、画像セグメンテーション、原本との比較、人間による最終確認を組み合わせるのが現実的です。
Comments
0 comments