寫小說、劇本、散文、廣告敘事或者品牌故事,最容易中伏嘅位係:一見 OpenAI 出新模型,就即刻當佢一定「最識寫」。但創意寫作唔係數學題,唔係得一個標準答案;重點係聲音、節奏、留白、角色一致性,同埋改稿時可唔可以保留原本味道。
OpenAI 自己嘅寫作用例,將 ChatGPT 描述成寫作者嘅 sounding board、story consultant、research assistant 同 editor——即係可以陪你傾橋、整理資料、改字句、做編輯;但呢個係使用情境,唔係一張「創意寫作模型排行榜」。[19]
保守而實用嘅結論係:先按任務揀模型,再用同一份 prompt 盲測。 如果你有 GPT-4.5,可以先放入創意寫作候選;如果冇,GPT-4.1 係較穩陣嘅日常主力;GPT-4.1 mini 適合腦暴同低風險初稿;GPT-5 系列值得測,但本文可用來源不足以證明佢已經喺小說、散文或者角色聲音上明確勝過 GPT-4.5。[2][
13][
16]
一眼睇:唔同寫作任務點揀
| 你要做咩 | 建議先試 | 點解 |
|---|---|---|
| 小說、散文、人物對白、品牌故事、高質精修 | GPT-4.5 | OpenAI 有獨立 GPT-4.5 介紹頁,提到 human collaboration 訓練方向,以及 ChatGPT/API 使用方式;非官方寫作比較亦將 GPT-4.5 描述為偏自然對話同寫作輔助。[ |
| Blog、電子報、長文初稿、日常改寫 | GPT-4.1 | OpenAI ChatGPT release notes 顯示 GPT-4.1 已開放予所有付費用戶;非官方模型選擇資料亦將 GPT-4 系列放喺 rich conversation、writing、long reads 等任務。[ |
| 標題腦暴、短文變體、設定清單、初稿打底 | GPT-4.1 mini | OpenAI release notes 顯示 GPT-4.1 mini 已取代 GPT-4o mini,成為 ChatGPT 所有用戶可用選項。[ |
| 劇情漏洞、世界觀規則、章節因果、工具流程 | o-series 輔助 | 非官方模型比較將 o-series 描述為偏 deliberate reasoning、tool use、STEM、code、agent flows;較適合查邏輯,未必係最終文風模型。[ |
| 想試最新模型 | GPT-5 系列同場盲測 | OpenAI model release notes 已列出 GPT-5 相關更新;但本文來源未見 GPT-5 與 GPT-4.5 喺小說、散文、角色聲音上嘅官方直接比較。[ |
點解唔好淨係揀「最新」?
創意寫作講求嘅,唔止係答得啱。你可能需要模型記住一個角色嘅口吻、保持某種疏離或者克制嘅語氣、避免太多 AI 式形容詞,甚至要喺第三稿、第四稿都唔好將文章洗成千篇一律嘅罐頭文。
有啲模型可能喺推理、工具使用或者程式任務更強,但唔代表一定更識寫小說開場、人物對白或者散文段落。OpenAI 官方寫作用例可以支持「ChatGPT 可以做寫作夥伴」呢件事;但唔足以推出「最新模型一定係最佳文學模型」呢個結論。[19]
GPT-5 亦應該咁睇。OpenAI model release notes 可以支持 GPT-5 系列已有更新;但 release notes 本身唔係創意寫作基準測試。就本文可用來源而言,未有官方資料直接證明 GPT-5 已全面取代 GPT-4.5,成為小說或者散文首選。[2]
GPT-4.5:創意寫作最值得先放入候選
如果你嘅 ChatGPT 或 API 環境可以揀 GPT-4.5,寫小說、散文、角色對白、品牌故事或者做高質潤飾,可以先由佢開始測。
呢個建議唔係因為 OpenAI 明文宣布 GPT-4.5 係「寫作冠軍」。更準確講,係目前訊號相對集中:OpenAI 為 GPT-4.5 提供獨立介紹頁,並列出 human collaboration 同 ChatGPT/API 使用方式;第三方寫作比較亦將 GPT-4.5 描述為自然、直覺對話同寫作輔助取向。[16][
9]
較適合用 GPT-4.5 測嘅任務包括:
- 小說開場
- 人物對白
- 散文段落
- 品牌故事
- 廣告敘事
- 將平淡草稿改到更有風格,但唔改走原意
不過要記住:呢個係基於模型定位同寫作需求嘅實務配對,唔係官方排名。[16][
19]
GPT-4.1:冇 GPT-4.5 時嘅穩定主力
GPT-4.1 最大優勢係可用性同通用寫作流程。OpenAI ChatGPT release notes 顯示 GPT-4.1 已提供畀所有付費用戶,所以如果你係每日都要產文——例如 blog、電子報、訪談整理、長文架構、段落擴寫、日常文案改寫——GPT-4.1 會係比較實際嘅選擇。[13]
如果你嘅需求係「要穩、要易攞到、要長期用」,GPT-4.1 往往比追逐少數高階模型更貼地。非官方模型選擇資料亦將 GPT-4 系列放喺 rich conversation、writing、long reads 呢類任務;呢個訊號唔等於官方保證,但同日常寫作場景相當吻合。[4]
GPT-4.1 mini:用嚟腦暴同打底,唔好迫佢做終稿主筆
GPT-4.1 mini 適合做標題變體、短文改寫、角色設定清單、衝突點發想、低風險初稿。佢最大優點係容易取得:OpenAI release notes 顯示 GPT-4.1 mini 已取代 GPT-4o mini,成為 ChatGPT 所有用戶可用嘅選項。[13]
但如果作品已經去到定稿階段,尤其你要求文風細膩、角色聲音穩定、長段落節奏自然,建議將 mini 產出嘅初稿交畀 GPT-4.5 或 GPT-4.1 再精修。呢個唔係話 mini 唔識寫,而係將佢放返喺更啱嘅工作位置。
o-series:當佢係「邏輯檢查員」會更好
o-series 唔一定係你想像中嘅文學主筆,但可以係好好嘅劇本醫生。非官方模型比較將 o-series 歸類為 deliberate reasoning、tool use、STEM、code、agent flows 等方向,所以可以用嚟檢查:
- 劇情有冇漏洞
- 世界觀規則有冇自相矛盾
- 章節因果係咪順
- 角色行動有冇違反前文設定
- 研究資料或者工具流程有冇甩漏
但最後要統一語氣、修文字、保留角色聲音,仍然建議返去你盲測入面表現最穩嘅 GPT 系列模型。[4]
GPT-5:值得測,但唔好預設贏晒
GPT-5 系列當然值得放入測試名單。OpenAI model release notes 顯示 GPT-5 系列有相關更新;但喺本文可用來源入面,呢點只足以支持「GPT-5 值得測」,未足以支持「GPT-5 已經係創意寫作最佳」。[2]
換句話講,如果你問「我應唔應該試 GPT-5?」答案係應該。若你問「係咪一定好過 GPT-4.5?」就要保守啲:用同一份 prompt、同一套評分標準,自己盲測先講。
20 分鐘做一次公平盲測
唔好每個模型問唔同題目,咁樣比唔公平。最簡單做法係:將 GPT-4.5、GPT-4.1、GPT-4.1 mini 同 GPT-5 放入同一份 prompt,產出後先隱藏模型名稱,再評分。
你可以用呢條測試題:
請寫一段 700 字短篇小說開場。主角是一位離開香港十年的攝影師,回到舊居整理父親遺物。語氣要克制、帶一點懸疑,不要過度煽情。避免常見 AI 式形容詞,讓場景細節推動情緒。
評分時睇六件事:
- 文字係咪自然,定似模板文案
- 角色聲音係咪穩定
- 場景有冇畫面感
- 有冇遵守字數、語氣同禁忌限制
- 改稿時可唔可以保留原本風格
- 有冇過度解釋角色心理
之後再測改稿能力:
保留原本克制的語氣,但讓第二段更有張力。不要增加新角色,不要解釋主角心理,只透過物件與動作呈現。
如果一改稿,模型就將文章變成通用雞湯、情緒過滿,或者不斷直接解釋角色心理,咁佢未必適合做你嘅主要創意寫作模型。
最後建議
一個保守排序可以咁睇:GPT-4.5 優先用於小說、散文、角色聲音同高質潤飾;GPT-4.1 係冇 GPT-4.5 時嘅日常主力;GPT-4.1 mini 適合腦暴同初稿;o-series 用嚟查邏輯;GPT-5 加入盲測,但唔好只因為名稱更新就自動排第一。[2][
4][
13][
16]
真正適合創意寫作嘅模型,未必係最新或者最大,而係最能夠穩定交出你要嘅聲音、節奏同改稿質素嗰個。




