開発者が知りたいのはたいてい、「2枚まで? 5枚? 10枚?」という単純な上限です。ところが、確認した範囲ではその数字は見つかりません。OpenAIのImages APIには画像編集メソッドがあり、Pythonリファレンスでは編集対象を「The image(s) to edit」と説明しています。ただし、確認したOpenAI公式リファレンスは、1回の編集リクエストで渡せるソース画像の最大枚数を数値では明記していません。[15][
16][
17]
公式情報から安全に言えること
プロダクト文言、仕様書、バリデーションルールに入れるなら、次の表現がもっとも安全です。
GPT Image 2 Editの編集ワークフローでは、複数形の画像入力を想定する記述がある一方、確認したOpenAI公式の画像編集リファレンスには、ソース画像の上限枚数は数値で公開されていない。[
15][
16][
17]
ポイントは、OpenAIのPython APIリファレンスにある「The image(s) to edit」という表現です。[16] これは単一画像だけに限定した書き方ではありません。一方で、「最大何枚」という上限を示す文言でもありません。そのため、別の提供元が明示していない限り、「最大10枚までアップロード可能」のような表現に置き換えるのは避けるべきです。[
16]
「入力画像」と「生成される画像数」は別物
画像APIでは、似ているようで別の2つの数が出てきます。
- ソース画像:編集の参照としてアップロードするファイル、または画像URL。
- 生成画像:モデルが返す出力画像。
混乱しやすいのは、ドキュメントによっては「何枚生成するか」を説明していて、「何枚アップロードできるか」を説明していないことです。たとえばZenlayerのOpenAI互換の画像編集リファレンスでは、「生成する画像数」は1〜10の範囲とされています。これは出力数の設定であり、ソース画像のアップロード上限ではありません。[19]
OpenVINOのOpenAI互換の画像編集例でも、同じ区別が必要です。例では image=@three_cats.png として1つのファイルを送り、別に n=4 を指定して複数の出力をリクエストしています。サンプルが1ファイルだからといって入力上限が1枚だとは言えず、n=4 だから4枚のソース画像を受け付けるという意味でもありません。[20]
サードパーティーのGPT Image 2 Editラッパーは「公式上限」の根拠にはならない
FalやWaveSpeedAIのようなサードパーティー提供のページは、実装時の参考にはなります。ただし、そこで示されるスキーマや説明は、そのままOpenAI公式の上限値とは見なせません。
Falの openai/gpt-image-2/edit ページには、リクエスト例として image_urls 配列が出てきます。配列なので複数画像を扱えそうな形ではありますが、掲載例に含まれるURLは1つで、ソース画像の最大枚数は公開されていません。[2]
WaveSpeedAIは、GPT Image 2 Editのワークフローで複数の参照画像をブレンドできると説明しています。ただし、これもプロバイダー側の説明であって、OpenAI公式の数値上限を示すものではありません。[22]
ChatGPTの画像アップロード制限とも分けて考える
OpenAIのChatGPT Image Inputs FAQでは、ChatGPTの会話に追加できる画像数は、画像サイズなど複数の要因によって変わると説明されています。[7] これはChatGPTの会話画面に関する話です。一方、Images APIのリファレンスは画像編集メソッドに関するものです。両者を同じ制限として扱うと、API実装のバリデーションを誤る可能性があります。[
7][
15]
実務では、ChatGPTのUI、サードパーティーのラッパーAPI、OpenAIのImages APIは、それぞれ別の制約を持ち得ます。ユーザーに見せるエラー文やフォーム制限は、実際に呼び出すシステムの仕様に合わせて設計するのが無難です。
開発時の実務メモ
- プロダクト文言は控えめにする。 提供元が明示していない限り、「最大10枚」よりも「複数の参照画像に対応」のほうが安全です。[
16][
19]
- 入力数と出力数を別々に管理する。 ソース画像の枚数と、
n、出力枚数、「images to generate」のような生成数パラメータを混同しないようにします。[19][
20]
- 上限はプロバイダーごとに設定できるようにする。 Fal、WaveSpeedAI、その他のラッパーを使う場合は、グローバルなOpenAI上限を仮定せず、そのプロバイダーのスキーマや実行時エラーで確認します。[
2][
22]
- ユーザー向けエラーは具体的にする。 エンドポイントが参照画像の枚数超過を拒否した場合は、「このプロバイダーでは現在○枚まで」のように実効上限として示し、OpenAI公式のGPT Image 2 Edit上限であるかのようには書かないほうが安全です。
まとめ
現時点で、確認したドキュメントから導ける答えは「最大○枚」ではありません。OpenAIの画像編集リファレンスには「image(s) to edit」という複数入力を示唆する表現がありますが、1回のGPT Image 2 Editリクエストで使えるソース画像の最大枚数は、確認した公式リファレンス上では数値として文書化されていません。[15][
16][
17]




