また、OpenAIの画像リファレンスには、プロンプトおよび/または入力画像から新しい画像を生成する、という趣旨の記述があります。 このため、少なくともOpenAIの画像API全体としては、テキストだけでなく入力画像を起点にするワークフローが想定されています。
OpenAI公式の確認済みソースは、主に「画像生成」と「画像編集」というワークフローの区別を示す点で強い根拠になります。 さらに、OpenAIの編集リファレンスの一部には、GPT image models向けにデフォルトで返される挙動への言及もあります。
一方で、GPT Image 2というモデル名を挙げた編集例として分かりやすいのは、Replicateとfal.aiのページです。ReplicateはGPT Image 2について、テキストから画像を作るだけでなく、既存画像を具体的な指示に沿って編集できると説明しています。 fal.aiは
openai/gpt-image-2/editを公開しており、例ではプロンプトとimage_urlsを渡しています。
開発時に注意したいのは、言葉の粒度です。日本語ではつい「画像をアップロードして編集」と言いたくなりますが、API仕様を読むときは入力画像と表現したほうが安全です。
たとえばfal.aiのGPT Image 2編集例では、image_urlsに画像URLを渡しています。 これはfal.aiの連携では画像URLを入力として受け取れることを示します。ただし、サードパーティーのラッパーや統合サービスで使われる
image_urlsというパラメータ名が、そのままOpenAIの直接APIでも同じ名前・同じ形式で使えるとは限りません。
OpenAI側のリファレンスは、プロンプトおよび/または入力画像という広い表現を使っています。 ただし、確認できるGPT Image 2モデルページの断片だけでは、GPT Image 2のOpenAIネイティブAPIにおける完全なリクエストスキーマ、入力制限、アカウントごとの利用可否までは読み取れません。
本番実装前には、必ず最新のOpenAIモデルページと画像編集リファレンスを確認するべきです。
既存画像を編集する場合、「この部分だけ変えたい」「ここは触らないでほしい」というニーズはよくあります。OpenAIのGPT Image向けCookbookでは、入力画像の特定部分を変更したくない場合にマスクを渡せると説明しています。
image_urlsは、fal.ai連携で確認できる指定方法です。OpenAIネイティブAPIでも同じパラメータ名だと決めつけないほうが安全です。GPT Image 2は、テキストから新しい画像を作るだけのモデルではありません。既存の入力画像を渡して編集するワークフローが、OpenAIの画像編集ドキュメントと入力画像に関する記述、さらにReplicateやfal.aiのGPT Image 2向け実装例から確認できます。
ただし、開発者が押さえるべき注意点もあります。とくに、サードパーティー連携で見えるimage_urlsのような項目をOpenAI直接APIの仕様と混同しないこと、そしてマスク編集を完全な境界指定と考えないことです。 本番投入前には、最新のOpenAI公式リファレンスでモデルの利用可否、入力形式、制限を確認するのが堅実です。
Comments
0 comments