換句話說,現在不能可靠地說 Claude Opus 4.7 一定寫得像香港人;也不能反過來說它一定不順。較準確的判斷是:公開證據不足,應以實際輸出樣本測試。
部分公開資料提到 Claude Opus 4.7 在編程基準、複雜任務與視覺輸入上有提升,例如 SWE-bench Verified 87.6%,以及圖像長邊解析度可達 2,576 像素。 這些資料對開發者很有參考價值,但它們量度的不是香港語感。
香港繁中、廣東話口語和英中夾雜,至少涉及以下幾種不同能力:
所以,即使一個模型在 coding 或 vision 表現強,也不能直接推論它能寫出自然的香港中文。要回答「順唔順」,仍然要看具體輸出。
比較可靠的做法,是先建立一組固定測試 prompt,讓模型在不同香港場景下產生樣本,再用同一份評分表審核。以下 5 類測試,較能反映日常使用情況。
用來測產品更新、服務通知、銀行或保險類資訊。重點是清楚、專業、沒有機器翻譯味。
請用香港繁體中文寫一段 SaaS 產品更新公告,語氣專業、清楚,不要太書面,也不要用台式或中國大陸網絡用語。
用來測禮貌、直接、跟進語氣和收結是否自然。
請寫一封給香港客戶的 follow-up email,提醒對方確認 quotation,語氣專業但不要太硬。
用來測簡潔、禮貌和責任承擔。太書面會顯得僵硬,太口語又可能不夠專業。
客戶問點解訂單遲咗兩日,請用香港 WhatsApp 客服口吻回覆,承認延誤、交代下一步,保持禮貌同簡短。
這類最能測 code-switching 是否自然。重點不是英文越多越好,而是英文詞是否放在合適位置。
請寫一段香港 office Slack message,提醒 team 今日 5pm 前交 campaign brief,明早 sync-up 前會 consolidate comments。
用來測本地感、品牌語氣和克制度。過度使用潮語,反而容易令品牌聲音失控。
請為一個香港本地咖啡品牌寫 3 條 Instagram caption,語氣輕鬆、有本地感,但不要過度使用潮語。
| 評分項目 | 檢查問題 |
|---|---|
| 繁簡與地區一致性 | 是否穩定使用繁體中文?有沒有混入不合適地區用字? |
| 香港書面語自然度 | 讀起來是否像香港人會寫的商業或日常文字? |
| 廣東話口語控制 | 是否自然、有禮貌,而不是過度堆砌潮語? |
| 英中夾雜 | 英文詞是否自然嵌入,而不是硬塞或逐字翻譯? |
| 場景語氣 | 正式公告、客服、社交文案和內部訊息的語氣是否有清楚分別? |
| 可編輯性 | 人手修改是否只需微調,還是需要大幅重寫? |
| 事實準確性 | 涉及日期、產品功能、價錢或政策時,是否需要另行核實? |
如果要比較 Claude Opus 4.7、其他 Claude 型號、ChatGPT 或 Gemini,應該保留同一組 prompt、同一份 style guide 和同一套評分標準。否則,每次題目不同,結果很難比較。
如果 Claude Opus 4.7 在正式公告、產品說明這類較穩定文字表現不錯,但在 WhatsApp 客服或社交 caption 明顯生硬,可以先限制它用於較正式內容,再加人工潤飾。
相反,如果它經常出現以下情況,就不宜直接用作面向香港客戶的內容:
更穩妥的做法,是建立一份香港用語 style guide,寫明品牌語氣、禁用詞、常用英文詞、繁中偏好,以及幾段合格範例。之後每次測試都用同一套 prompt 和評分表,才可以判斷模型是否真的適合香港市場。
Claude Opus 4.7 的存在與 API model ID,可以由 Anthropic 官方來源確認。 但就「寫香港繁體中文、英中夾雜、香港常用語是否夠順」這條問題,現有公開資料仍然不足;公開來源主要支持它在編程、agentic workflows 和視覺能力方面的討論,而不是香港語言本地化能力。
因此,最準確的答案不是「一定順」或「一定唔順」,而是:未核實。若要把 Claude Opus 4.7 用於香港內容生產、客服或品牌語氣,應以實際輸出樣本和香港讀者人工評審作準。
Comments
0 comments