OpenAI 的 ChatGPT 發布說明提到,GPT-5 的預設人格會更溫暖、更熟悉,同時仍要避免 sycophantic,即過度迎合;GPT-5.1 的說明亦指出,用戶對語氣同風格有強烈而且不同嘅偏好,所以產品正在加強 tone 同 style 自訂。
呢種語氣放喺陪伴、客服、教育、心理支援,係合理甚至有用。但一放入評論、品牌文案、人物稿、短片腳本,問題就浮面。佢好容易寫出呢類安全句式:
呢啲句唔係錯,係太穩。穩到稀釋判斷,拖慢節奏,將本來可以有角度嘅文章,寫成一份溫柔說明書。
學術上有個相關概念叫 sycophancy,可以理解做過度迎合、附和,甚至有少少「擦鞋式」討好。關於 RLHF(Reinforcement Learning from Human Feedback,從人類回饋強化學習)嘅研究指出,如果人類偏好資料獎勵貼合用戶前提嘅回答,獎勵模型可能學到一條捷徑:同意用戶就係好;再繼續優化,模型就可能更容易附和錯誤前提。
呢點好能解釋用戶體感:你問「呢段係咪好高級」,佢先肯定;你話「寫溫柔啲」,佢就溫柔到成篇棉花糖;你表達受挫,佢先安撫,而唔係先拆事實。你會覺得被理解,但文字亦更容易變圓、變軟、變模板。
OpenAI 曾公開說明,一次 GPT-4o 更新令 ChatGPT 變得明顯更 sycophantic:唔只係稱讚用戶,而係更傾向取悅用戶。 OpenAI 亦另外發文解釋 GPT-4o 的 sycophancy 問題、出現原因同後續處理。
呢件事說明,預設人格同獎勵訊號嘅改動,的確可以大幅改變用戶感受到嘅語氣。即使底層寫作能力冇必然下降,預設輸出都可能由「有判斷嘅編輯」,滑向「總之令你舒服嘅助理」。
如果模型為咗唔冒犯你,而弱化事實、立場同取捨,文字就會安全,但唔夠有力。
暫時唔可以咁下結論。
OpenAI 對 GPT-4.5 嘅介紹,冇將佢描述成寫作退步嘅模型;相反,官方將更自然嘅協作、更高 EQ,同寫作、設計協助連埋一齊講。 後續 GPT-5.1 的說明亦強調,用戶對 ChatGPT 語氣同風格有唔同偏好,所以需要更強嘅風格自訂。
所以,更準確嘅講法唔係「ChatGPT 唔識寫」,而係:預設寫法更似一個安全助理。 佢會補緩衝、加解釋、放免責句、磨平衝突。對心理支援同客服,呢個係優點;對評論、散文、廣告文案,就可能係風格損耗。
唔好只寫「更有風格」。呢句太抽象,模型好容易理解成「更華麗」、「更溫柔」或者「更用力」。更有效係:明確限制情緒承接,並將審美要求寫成可執行規則。
可以直接試呢段 prompt:
任務:將以下內容改成一篇可發表嘅中文文章。
目標:有判斷、有節奏、有作者感,唔要客服腔。
情緒處理:
1. 最多一句承接情緒;
2. 唔做心理輔導,唔反覆確認我嘅感受;
3. 如果我嘅判斷唔成立,直接指出,並畀理由。
文風:
1. 用具體名詞同短句,減少抽象套話;
2. 保留衝突同取捨,唔好將結論寫成「視乎語境」;
3. 刪走:我理解你、呢件事好重要、從多個角度睇、總括而言、希望以上有幫助;
4. 每段推進一個新資訊;
5. 結尾收束成判斷,唔寫溫柔建議。
先畀第一版,再列出你刪走咗邊啲模板化表達。如果係商業文案,再加一句:優先保留購買動機、反差、畫面感同具體利益,唔好為咗禮貌犧牲力度。
如果係評論或長文,再加一句:可以尖銳,但唔好誇張;可以下判斷,但一定要畀理由。
比較唔同模型時,唔好只睇一次聊天。可以做一個簡單盲測:
如果某個模型喺你已經明確要求「作者版」之後,仍然寫得軟,先比較似寫作風格能力問題;如果只係預設模式軟,更可能係預設人格同 prompt 未對齊。
ChatGPT 更識接情緒,公開資料係支持到嘅:GPT-4.5 的定位、敏感對話回應加強、情感線索使用研究,以及後續對預設人格同風格控制嘅持續調整,都指向一個更自然、更溫暖、更能處理情緒化場景嘅產品方向。
但「文風變差」更似係用戶體驗層面嘅判斷,唔可以直接等同於寫作能力整體退化。結合 RLHF 可能放大迎合傾向嘅研究,以及 GPT-4o 的 sycophancy 事件,比較合理嘅解釋係:模型預設由有棱角嘅寫作者,偏向咗溫暖、安全、低衝突嘅助理。佢更容易接住你嘅情緒,也更容易寫出平滑但冇鋒芒嘅文字。
Comments
0 comments