如果你在寫產品規格、API 驗證或前端提示,最想要的答案通常是一個明確數字:2 張、5 張、10 張。問題是,就目前審閱到的資料來看,這個數字不能從官方文件中安全推出。
OpenAI 的 Images API 包含圖片編輯方法;其 Python API 參考把編輯輸入寫成「The image(s) to edit」,也就是「要編輯的圖片(一張或多張)」的意思。不過,審閱到的 OpenAI 官方圖片編輯參考文件並沒有公布單次 edit request 可放入多少張來源圖片的數字上限。[15][
16][
17]
可以安全寫進文件的說法
若你需要一段不誇大、可放進產品文件或開發註解的描述,可以採用:
GPT Image 2 Edit 工作流程原則上支援複數圖片輸入,但審閱到的 OpenAI 官方圖片編輯參考文件沒有記載來源圖片的數字上限。[
15][
16][
17]
這裡的關鍵是 OpenAI Python API 參考中的「image(s) to edit」。[16] 這句話表示該欄位並非只以單張圖片為前提;但它也不是一個上限公告,所以不應在沒有其他供應商明確文件的情況下,改寫成「最多可上傳 10 張來源圖」之類的說法。[
16]
先分清楚:來源圖片 vs. 輸出圖片
很多誤會來自同一個 API 流程中有兩種「圖片數量」:
- 來源圖片(source images): 使用者上傳的檔案,或提供給模型作為編輯參考的圖片 URL。
- 輸出圖片(generated images): 模型完成後回傳的生成結果。
有些文件談的是「要生成幾張圖」,不是「可以上傳幾張來源圖」。例如 Zenlayer 的 OpenAI 相容圖片編輯參考寫到「number of images to generate」必須介於 1 到 10;這是輸出設定,不是來源圖片上傳上限。[19]
OpenVINO 的 OpenAI 相容圖片編輯範例也呈現同樣差異:範例用 image=@three_cats.png 傳入一個來源檔案,並另外用 n=4 要求多張輸出。範例只示範一個來源檔案,不能證明來源圖片上限就是一張;同樣地,n=4 也不代表可上傳四張來源圖。[20]
第三方 GPT Image 2 Edit 服務不能代替官方上限
若你透過 Fal、WaveSpeedAI 或其他平台呼叫 GPT Image 2 Edit,第三方文件對實作很有幫助,但不能自動視為 OpenAI 官方限制。
Fal 的 openai/gpt-image-2/edit 頁面在範例請求中使用 image_urls 陣列,這與「可放多個圖片 URL」的欄位形狀相符;但該範例只列出一個 URL,也沒有公布來源圖片的最大張數。[2]
WaveSpeedAI 則描述 GPT Image 2 Edit 可混合多個參考圖的工作流程;這可以說明第三方服務如何包裝與介紹功能,但仍不是 OpenAI 官方公布的來源圖片數字上限。[22]
ChatGPT 的上傳限制是另一回事
OpenAI 的 ChatGPT Image Inputs FAQ 說,使用者在 ChatGPT 對話中一次能加入多少張圖片,會受到圖片大小等因素影響。[7] 這份 FAQ 談的是 ChatGPT 產品介面中的對話上傳行為;Images API 參考文件談的是圖片編輯方法。把兩者混成同一個限制,容易寫出錯誤的前端驗證或後端限制。[
7][
15]
對開發者來說,這個差別很實際:ChatGPT 介面、第三方 wrapper 的 schema,以及 OpenAI Images API,都可能各自有不同的限制與錯誤行為。你要驗證的,應該是你實際呼叫的那個系統。
給開發者的實務建議
- 產品文案保守一點。 若沒有供應商明確文件,寫「支援多張參考圖」比寫「最多可上傳 10 張來源圖」安全得多。[
16][
19]
- 把輸入與輸出數量分開處理。 來源圖片數量應與
n、輸出張數、或任何「images to generate」參數分開記錄與驗證。[19][
20]
- 不同供應商用不同設定。 如果你呼叫 Fal、WaveSpeedAI 或其他包裝服務,應測試該供應商的 schema 與 runtime error,而不是假設存在一個全球一致的 OpenAI 上限。[
2][
22]
- 錯誤訊息說清楚。 若某端點拒絕太多參考圖,回報「此供應商目前允許的有效上限」,不要暗示那就是 GPT Image 2 Edit 的官方上限。
結論
以目前審閱到的文件,答案不是一個可靠的數字。OpenAI 圖片編輯參考透過「image(s) to edit」顯示編輯輸入可以是複數圖片,但沒有記載單次編輯請求的來源圖片最大張數。[15][
16][
17]




