要用 OpenAI 模型寫小說、劇本、散文或品牌故事,最容易犯的錯是把「最新」直接等同「最會寫」。OpenAI 的寫作用例頁把 ChatGPT 描述為寫作者的 sounding board、story consultant、research assistant 與 editor,但這是使用情境,不是創意寫作模型排行榜。[19]
本文採取保守結論:先按任務選模型,再用同一份 prompt 盲測。若能使用 GPT-4.5,創意寫作可優先把它放進候選;若沒有,GPT-4.1 是較務實的主力,GPT-4.1 mini 適合腦暴與低風險初稿。GPT-5 系列值得測,但本文可用來源不足以證明它已在創意寫作上明確勝過 GPT-4.5。[2][
13][
16]
快速選擇表
| 寫作任務 | 建議先試 | 為什麼 |
|---|---|---|
| 小說、散文、人物對話、品牌故事、精修 | GPT-4.5 | OpenAI 有獨立 GPT-4.5 介紹頁,包含人機協作訓練與 ChatGPT/API 使用說明;次級寫作比較也把 GPT-4.5 描述為自然對話與寫作輔助取向。[ |
| 部落格、電子報、長文初稿、日常改寫 | GPT-4.1 | OpenAI ChatGPT release notes 顯示 GPT-4.1 已提供給所有付費用戶;次級模型選擇資料也把 GPT-4 系列歸在 rich conversation、writing、long reads 等任務。[ |
| 標題腦暴、短文變體、初稿打底 | GPT-4.1 mini | OpenAI release notes 顯示 GPT-4.1 mini 取代 GPT-4o mini,成為 ChatGPT 所有用戶可用選項。[ |
| 劇情漏洞、世界觀規則、結構檢查、工具流程 | o-series 輔助 | 次級模型比較把 o-series 描述為偏推理、工具使用、STEM、程式與 agent flows;它更適合檢查邏輯,不一定適合作為最終文風模型。[ |
| 想比較最新模型 | GPT-5 系列同場盲測 | OpenAI model release notes 已列出 GPT-5 相關更新;但本文來源沒有提供 GPT-5 與 GPT-4.5 在小說、散文或角色聲音上的官方直接比較。[ |
為什麼不能只選「最新模型」?
創意寫作的核心不是單一正確答案,而是聲音、節奏、限制遵守與改稿保真度。模型可能在某些推理或工具任務上更強,卻不一定更會保留角色口吻或段落氣味。OpenAI 官方寫作用例能支持「ChatGPT 可作為寫作夥伴」這件事,但不能推出「某個最新模型一定是最佳文學模型」的結論。[19]
這也是 GPT-5 需要保守看待的原因。OpenAI 的 model release notes 可以支持 GPT-5 系列已有更新,但 release notes 並不是創意寫作基準測試;在本文可用來源中,沒有官方資料直接證明 GPT-5 已全面取代 GPT-4.5 成為小說或散文首選。[2]
GPT-4.5:最值得先放進創意寫作候選名單
如果你的 ChatGPT 或 API 環境能選 GPT-4.5,小說、散文、角色對話與高品質潤飾可以先從它開始。這不是因為 OpenAI 明文宣布 GPT-4.5 是寫作冠軍,而是目前訊號相對集中:OpenAI 為 GPT-4.5 提供獨立介紹頁,並列出 human collaboration 與 ChatGPT/API 使用方式;第三方寫作比較也把它描述為自然、直覺對話與寫作輔助取向。[16][
9]
適合用 GPT-4.5 測的任務包括:小說開場、人物對話、散文段落、品牌故事、廣告敘事,以及把平淡草稿改成更有風格但不失原意的版本。這些建議是基於模型定位與寫作需求的實務匹配,不是官方排行榜。[16][
19]
GPT-4.1:沒有 GPT-4.5 時的穩定主力
GPT-4.1 的優勢是可用性與通用寫作流程。OpenAI ChatGPT release notes 顯示 GPT-4.1 已提供給所有付費用戶,因此它更適合需要長期穩定產出的人,例如部落格、電子報、訪談整理、長文架構、段落擴寫與日常文案改寫。[13]
若你的需求是「每天都要寫、要穩、要容易取得」,GPT-4.1 通常比追逐少數高階模型更實際。次級模型選擇資料也把 GPT-4 系列放在 rich conversation、writing、long reads 這類任務;這個訊號不等於官方保證,但與日常寫作場景相符。[4]
GPT-4.1 mini:用在腦暴與初稿,不必負責最後定稿
GPT-4.1 mini 適合標題變體、短文改寫、角色設定清單、衝突點發想與低風險初稿。它的最大優點是可取得性:OpenAI release notes 顯示 GPT-4.1 mini 已取代 GPT-4o mini,成為 ChatGPT 所有用戶可用的選項。[13]
但若作品進入定稿階段,尤其要求細膩文風、角色聲音穩定與長段落節奏,建議把初稿交給 GPT-4.5 或 GPT-4.1 再精修。這是工作流建議,不代表 mini 模型不能寫,而是把它放在更適合的位置。
o-series 與 GPT-5 怎麼放進工作流?
o-series 更適合當「邏輯檢查員」。次級模型比較把 o-series 歸在 deliberate reasoning、tool use、STEM、code、agent flows 等方向,因此可用來檢查劇情漏洞、世界觀規則、章節因果與資料整理;但最後的文風統一,仍建議回到你盲測中表現最穩的 GPT 系列模型。[4]
GPT-5 則應該納入同場測試,而不是預設勝出。OpenAI 的 model release notes 顯示 GPT-5 系列持續更新;但在本文可用來源中,這只能支持「GPT-5 值得測」,不能支持「GPT-5 已是創意寫作最佳」。[2]
用 20 分鐘做一個公平盲測
不要每個模型問不同題目。最簡單的方法是把 GPT-4.5、GPT-4.1、GPT-4.1 mini 與 GPT-5 放進同一份 prompt,隱藏模型名稱後評分。
可以使用這個測試題:
請寫一段 700 字短篇小說開場。主角是一位離開台北十年的攝影師,回到老家整理父親遺物。語氣要克制、帶一點懸疑,不要過度煽情。避免常見 AI 式形容詞,讓場景細節推動情緒。
評分時看六件事:
- 文字是否自然,不像模板文案
- 角色聲音是否穩定
- 場景是否有畫面感
- 是否遵守字數、語氣與禁忌限制
- 改稿時是否保留原本風格
- 是否避免過度解釋角色心理
接著再測一次改稿能力:
保留原本克制的語氣,但讓第二段更有張力。不要增加新角色,不要解釋主角心理,只透過物件與動作呈現。
如果模型一改稿就把文字洗成通用、情緒過滿或解釋太多的版本,它就不適合作為你的主要創意寫作模型。
最終建議
保守排序可以這樣看:GPT-4.5 優先用於小說、散文、角色聲音與高品質潤飾;GPT-4.1 是沒有 GPT-4.5 時的日常主力;GPT-4.1 mini 適合腦暴與初稿;o-series 用來檢查邏輯;GPT-5 加入盲測,但不要只因為名稱更新就自動排第一。[2][
4][
13][
16]
真正適合創意寫作的模型,不一定是最新或最大,而是能穩定產出你要的聲音、節奏與改稿品質的模型。




