如果你正喺產品入面加 GPT Image 2 生成圖或改圖功能,最易踩中嘅坑唔係「有冇見過 1024x1024」,而係:呢個值係 OpenAI 官方確認嘅完整支援尺寸,定只係 API 文件入面其中一個例子?
謹慎結論係:OpenAI 文件有 GPT Image 2 模型頁 [1];OpenAI Images API 有
size 欄位,用嚟表示生成圖片嘅尺寸 [18];
Create image editsize: "1024x1024"14]。但以目前提供嘅來源,未足以整理出一張「GPT Image 2 全部合法尺寸」清單,亦未足以確認 GPT Image 2 對輸入圖片嘅完整限制。
先分清:例子唔等於完整規格
API 文件入面出現 1024x1024,可以證明「文件例子曾經用過呢個值」;但唔可以直接推論成「GPT Image 2 只支援呢個尺寸」,亦唔可以反過嚟推論成「一定支援所有常見橫圖、直圖、4K 或自訂比例」。
對工程實作嚟講,最安全寫法係:OpenAI Images API 有 size 欄位;Create image edit1024x1024;但目前引用來源未列出 GPT Image 2 專屬嘅完整 size 合法值 [14][
18]。
目前可以確認嘅資料
| 問題 | 謹慎結論 | 來源 |
|---|---|---|
| OpenAI API 文件入面有冇 GPT Image 2? | 有。OpenAI 文件有一個標題為 GPT Image 2 嘅模型頁。 | [ |
| OpenAI Images API 有冇生成圖同改圖? | 有。API reference 有 | [ |
| API 有冇圖片尺寸欄位? | 有。Images 文件描述 size 係生成圖片嘅尺寸,並同時提到 background、output_format、quality 等欄位。 | [ |
可唔可以確認 1024x1024? | 可以,但只限於:它出現喺 image edit 文件例子入面。 | [ |
| 可唔可以列晒 GPT Image 2 支援嘅所有尺寸? | 未得。提供來源未足以列出完整清單。 | [ |
| 可唔可以確認輸入圖片限制? | 未得。提供來源未足以確認 GPT Image 2 專屬嘅輸入格式、最大檔案大小、最大解像度或每個 request 可用幾多張輸入圖。 | [ |
輸出尺寸:有 size,但未見完整 enum
OpenAI Images 文件將 size 描述為生成圖片嘅尺寸,亦提到 GPT image models 相關嘅 token usage,以及 background、output_format、quality 等設定 [18]。
目前最具體嘅尺寸證據,係 Create image editoutput_format: "png"quality: "low"size: "1024x1024"14]。
但呢個例子未足以證明 GPT Image 2 只支援 1024x1024,亦未足以證明佢支援某個完整尺寸組合,例如方圖、橫圖、直圖或 4K。換句話講,寫技術文件、設計 product schema 或做 validation rule 時,唔應該將 API reference 入面一個 sample value,直接寫成官方支援矩陣 [14][
18]。
輸入圖片同 image edit:有流程,但限制未能一口咬定
OpenAI 有 Create image edit14][
15]。OpenAI Cookbook 亦描述咗用 mask 做 image edit 嘅 workflow:如果唔想模型改動輸入圖片某一部分,可以提供 mask [
21]。
不過,mask 唔應該被理解成「絕對唔會改到」嘅保證。Cookbook 明確提醒:模型仍然可能會修改 mask 內某些部分,只係會嘗試避免;如果需要精準 mask,文件建議使用 image segmentation model [21]。
所以,目前可以確認嘅係:
- OpenAI Images API 有改圖 reference [
14][
15]。
- image edit 有可使用 mask 嘅 workflow [
21]。
- mask 唔係 pixel-perfect 保護層,QA 時要預咗有機會出現偏差 [
21]。
相反,現有來源未足以確認 GPT Image 2 專屬嘅輸入圖片格式、檔案大小上限、輸入解像度上限、每個 request 可放幾多張圖,或者 alpha channel 嘅硬性要求 [14][
15][
21]。
第三方 provider 文件要同 OpenAI 官方文件分開睇
有啲第三方 provider 亦有 GPT Image 2 頁面。Runware 將 GPT Image 2 描述為 GPT Image family 入面一個通用 model,可用於 text-to-image generation 同 image editing [3]。Fal.ai 亦有 GPT Image 2.0 頁面,提供 playground、API 同佢自己嘅 schema [
6]。
呢啲頁面對使用該 provider 嘅人有用;但如果你係直接 call OpenAI API,就要分清兩層:一層係 OpenAI 官方 API 文件,另一層係中介 provider 自己嘅 schema、enum 同限制。第三方 schema 入面某個尺寸 enum 或檔案限制,唔會自動變成 OpenAI API 嘅官方規格 [3][
6]。
實作 checklist:點樣寫得穩陣啲
- 唔好只憑
1024x1024hard-code 全部尺寸規則。 呢個值出現喺 image edit 例子,但引用來源未顯示它係 GPT Image 2 完整支援清單 [14]。
- 上線前再查 OpenAI 文件。 如果你直接 call OpenAI,GPT Image 2 模型頁同 OpenAI Images API reference 先係應該核對嘅地方 [
1][
18]。
- 用 mask 要做足 QA。 OpenAI 提醒模型仍可能改到 mask 內部分內容;mask 唔應該當成絕對保護 [
21]。
- 按 provider 分開配置。 經 Runware 或 Fal.ai 使用,就跟返該 provider schema;直接用 OpenAI,就跟 OpenAI 文件 [
3][
6]。
總結
短答係:GPT Image 2 確實出現喺 OpenAI API 文件 [1];OpenAI Images API 有
size 欄位表示生成圖片尺寸 [18];
Create image edit1024x1024 [14]。但基於目前提供嘅來源,未可以公布一份 GPT Image 2 官方完整圖片尺寸清單,亦未可以確認完整輸入圖片限制。




