| 廣告圖、poster、標籤、UI mockup、圖解、包裝,先用 GPT Image 2。 |
| 快速試稿同大量變體 | Google Skills 形容 Gemini 2.5 Flash Image(即 Nano Banana)支援高速圖片生成、prompt 改圖同視覺推理 | 做草稿、方向探索、Gemini 原生 app,Nano Banana 仍然好順手。 |
今次最乾淨嘅公開榜單訊號,來自 Artificial Analysis。佢嘅 Text to Image Arena 片段顯示,**GPT Image 2(high)**以 1331 Elo 排第一,喺可見排名入面高過 GPT Image 1.5 同 Nano Banana 2 。
所以,如果問題只係:「邊個模型喺公開 text-to-image benchmark 訊號較強?」答案係 GPT Image 2。
不過,Elo 榜唔等於宇宙真理。佢反映嘅係某一套評測設計、某個模型版本、某批 prompt,同人類偏好投票。模型更新、prompt 寫法、抽樣設定一變,排名都可以郁。
其他報道大方向都偏向 GPT Image 2。Neurohive 指 GPT Image 2 按 LM Arena 資訊喺多個圖片生成類別取得第一,並聲稱較最近競爭者領先 +242 Elo 。CalcPro 亦報道 GPT Image 2 text-to-image 分數為 1512,並指較 Nano Banana 2 領先 +242 Elo
。不過,若要用較保守、適合採購或技術決策嘅講法,最好仍然落喺可見榜單片段:Artificial Analysis 顯示 GPT Image 2 以 1331 Elo 領先 text-to-image 榜
。
改圖方面,現有證據唔支持「GPT Image 2 完全碾壓 Nano Banana」呢種講法。
Artificial Analysis 圖像編輯榜片段顯示,GPT Image 1.5(high)以 1267 Elo 排第一,GPT Image 2(high)以 1251 排第二,Nano Banana Pro(Gemini 3 Pro Image)以 1250 排第三 。GPT Image 2 同 Nano Banana Pro 只差 1 Elo,單憑呢個片段,唔應該當成決定性勝利。
Arena.ai 圖像編輯榜片段亦顯示 gemini-2.5-flash-image-preview (nano-banana)。
實務建議好簡單:如果你主要做改圖,唔好只睇總榜。用你自己嘅產品相、人像、設計稿、mask、reference image 同修改 prompt,兩邊各跑一輪。
GPT Image 2 喺來源入面相對清楚。OpenAI 開發者文件列出模型為 gpt-image-2-2026-04-21,亦顯示 API 使用嘅分層 rate limits 。OpenAI 價格頁則列出 GPT-image-2 作為圖像生成模型,並提供 image input、cached image input、image output、text input、cached text input 等 token-based 價格
。
Nano Banana 呢個名就比較多變。Google 圖像生成文件以 Gemini API 呈現 Nano Banana image generation,示例程式碼入面見到 gemini-3.1-flash-image-preview 。Google Skills 又將 Gemini 2.5 Flash Image 稱為 Nano Banana,定位係高速圖片生成、prompt-based editing 同 visual reasoning
。Artificial Analysis 改圖榜亦用到另一個相關名稱:Nano Banana Pro,並標示為 Gemini 3 Pro Image
。
呢點唔係吹毛求疵。你見到「Nano Banana 2」、「Nano Banana Pro」、「Gemini 2.5 Flash Image」或者「Gemini 3.1 Flash Image Preview」嘅 benchmark,未必量度緊同一條 API route 或同一個模型版本。做正式比較時,要記低精確模型名、API route、測試日期、解像度同設定。
GPT Image 2 最適合用喺「錯咗之後好麻煩」嘅任務。Analytics Vidhya 嘅比較指出,當圖片內文字必須正確、prompt 涉及多重限制或版面、又或者輸出一致性重要時,GPT-image-2 較合理 。另一個 hands-on 比較亦用一句幾貼地嘅說法總結:GPT 贏喺「每一個字都重要」嘅場景;Nano Banana 贏喺「每一粒光影像素都重要」嘅場景
。
你可以先用 GPT Image 2 做:
Nano Banana 喺呢批來源入面最強嘅優勢,唔係單一榜單冠軍,而係工作流貼合度。
Google Nano Banana 文件列出多個 aspect ratio,並有 resolution 設定,可選 512、1K、2K、4K 。如果你嘅產品規格寫明要有官方文件可核實嘅 4K generation path,喺呢批來源入面,Google 文件比 OpenAI 片段更易直接確認。
另外,Nano Banana 亦明顯偏向速度同迭代。Google Skills 形容 Gemini 2.5 Flash Image/Nano Banana 支援高速圖片生成、prompt-based editing 同 visual reasoning 。一篇 hands-on 比較得出嘅結果亦比「榜單大勝」敘事接近得多:2 項 GPT 贏、2 項 Nano Banana 贏、2 項打和
。
你可以先用 Nano Banana 做:
OpenAI GPT-image-2 嘅價格喺提供來源入面較清楚。OpenAI 價格頁列出:image input 每 100 萬 tokens US$8、cached image input 每 100 萬 tokens US$2、image output 每 100 萬 tokens US$30、text input 每 100 萬 tokens US$5、cached text input 每 100 萬 tokens US$1.25 。
OpenAI GPT Image 2 模型頁亦顯示分層 rate limits。可見片段入面,Free 不支援;Tier 1 為 100,000 TPM、5 IPM;Tier 5 達 8,000,000 TPM、250 IPM 。
至於 Nano Banana,提供嘅 Google 官方圖像生成片段確認咗 Gemini API route、aspect ratio 同解像度選項,但未見到可以直接同 OpenAI 對照嘅價格表 。Analytics Vidhya 指 Nano Banana 2 在大規模使用、尤其 batch processing 時成本明顯較低
;但呢個係第三方比較說法。真正落 production 前,仍然要核實準確 Google model variant、API route、解像度、batch mode 同最新 billing page。
比較兩個模型時,建議至少做到:
如果你要一句 benchmark verdict:揀 GPT Image 2。Artificial Analysis 將 GPT Image 2(high)列為 text-to-image 第一,Elo 1331 。對文字密集、版面敏感、指令複雜嘅圖片生成,佢係較合理嘅第一選擇。
但如果你係為產品或團隊設計 production setup,就唔應該所有圖都只丟畀一個模型。比較穩陣嘅做法係:
一句收尾:GPT Image 2 贏咗 benchmark 標題;Nano Banana 仍然贏到唔少真實工作流。
Comments
0 comments