再睇 GPT Image 2 相關整合:Replicate 形容 GPT Image 2 可以由文字生成圖片,亦可以 edit existing images;fal.ai 則提供 openai/gpt-image-2/edit endpoint,示例請求入面包含 prompt 加 image_urls。
對產品經理或用家嚟講,「上載圖片」好易明;但對開發者嚟講,較安全的說法係 input image。OpenAI 的 images reference 用的是「prompt and/or an input image」呢種較闊的表述,表示模型可以基於文字提示及/或輸入圖片產生新圖片。
不過,唔好將第三方平台的參數名直接當成 OpenAI 原生 API 參數。fal.ai 的 GPT Image 2 edit 例子明確使用 image_urls,所以可以確認呢個整合接受圖片 URL;但呢個唔等於 OpenAI 官方 API 一定用同一個欄位名或同一套傳圖方式。
目前已查到的 OpenAI GPT Image 2 model page snippet 未有完整列出所有原生 request schema、輸入限制或可用性細節;如果你準備上 production,應該再核對最新官方 model page 同 image edit reference。
OpenAI 的 GPT Image cookbook 提到,edit workflow 可以提供 mask,用嚟表示你唔想模型改動輸入圖片的某一部分。 但同一段文件亦提醒:模型仍然可能改到 mask 入面某些部分;如果需要非常精準的 mask,OpenAI 建議可以使用 image segmentation model。
GPT Image 2 唔應該被理解成只係 text-to-image。根據已查文件同整合例子,它可以用於編輯已提供的 input image/reference image;OpenAI 文件支持 edit/input-image workflow,而 Replicate 同 fal.ai 就提供較直接的 GPT Image 2 編輯例子。
真正要小心的是 API 層面:OpenAI 原生 API、Replicate、fal.ai 呢類平台可能有不同 endpoint、參數名、圖片傳入方式同限制。要正式落地,最好用「可以編輯 input image」做產品結論,再用當前官方 API reference 核實實作細節。
Comments
0 comments