size、または幅・高さ指定で受け付ける値したがって安全な言い方は、GPT Image 2というモデルページは確認できるが、サイズ・比率・参照画像入力の自由度がGPT Image 1.5よりどれだけ上がったかは、現時点の資料では量的に確認できない、です。
OpenAIのGPT Image 1.5モデルページでは、GPT Image 1.5は画像生成モデルとして説明され、instruction followingやprompt adherenceが改善されたモデルとされています。 また、OpenAI APIにはGPT Image 2のモデルページも存在します。
Images APIのリファレンスでは、Generate an ImageとEdit an Imageに対応するエンドポイントが確認できます。 Python版とTypeScript版のImagesリファレンスにも、GPT image modelsに関する記述があり、生成画像の
size、background、output formatqualityなどの項目が示されています。
ここまでで確認できるのは、「画像生成」「画像編集」「サイズなどの項目」がAPI資料に存在することです。一方で、GPT Image 1.5とGPT Image 2がそれぞれどのサイズを受け付けるのか、任意の比率に対応するのか、参照画像入力の制限が変わったのかまでは、この資料だけでは判断できません。
Leonardo.AIのGPT Image-1.5向けREST API例には、width、height、seed、guidances.image_referenceが登場します。falの資料にはimage_size、background、qualityがあり、WaveSpeedAIの編集API資料にはsize、quality、input_fidelity、output_formatが示されています。Higgsfieldのガイドには、1:1、2:3、3:2などの比率選択例があります。
これらは、各プラットフォームがGPT Image 1.5をどう組み込んでいるかを知る手がかりにはなります。ただし、第三者サービスは独自のパラメータ名、初期値、UI上の選択肢、内部的な制限を設けている可能性があります。そのため、あるサービスでwidthやheightが指定できるからといって、それをOpenAIネイティブAPIの全能力とみなすことはできません。
同じ理由で、第三者UIに表示されたアスペクト比の選択肢を、GPT Image 2との公式な差分として扱うこともできません。
この主張をきちんと検証するには、少なくとも次のような情報が必要です。
sizeの受け付け値、固定サイズ一覧、最小値・最大値が示されていることこれらがない段階では、「GPT Image 2のほうが自由」という表現は、確認済みの事実ではなく未検証の仮説として扱うべきです。
GPT Image 1.5からGPT Image 2へ移行するかを検討する場合、サイズやアスペクト比の自由度だけを判断材料にするのはおすすめできません。画質、プロンプト追従性、生成速度、コスト、API制限を分けて評価し、API制限については公式ドキュメントと実際のエラー挙動を確認するのが堅実です。
実務上は、同じプロンプトと同じ入力素材を使い、サイズ、縦横比、参照画像枚数、ファイル形式を1つずつ変えるテスト表を作ると判断しやすくなります。成功、拒否、エラーメッセージを記録し、公式パラメータ表または再現可能なテスト結果で差分が見えたときに初めて、「GPT Image 2はより多くのサイズに対応する」「参照画像の制限が緩和された」といった表現を使うべきです。
現時点で最も安全な書き方は、次のようなものです。
OpenAIのAPI資料ではGPT Image 1.5とGPT Image 2のモデルページ、画像生成・画像編集エンドポイント、
sizeやqualityなどの関連項目は確認できる。ただし、参照した資料の範囲では、両モデルのカスタムサイズ、アスペクト比、参照画像入力制限を比較する完全な公式情報は見当たらない。そのため、GPT Image 2がGPT Image 1.5よりこれらの点でどれだけ自由になったかは、現時点では確認できない。
つまり、今の段階で言えるのは「より自由になった」と断定することではなく、「公式の比較情報が不足しているため、自由度の差はまだ確認できない」ということです。
Comments
0 comments