人睇人鍾意: Markdown經常用嚟整prompt同instruction file,令到人類同AI模型都更容易睇得明 。OpenAI官方Playground都建議用Markdown H1標題嚟生成prompt
。
最大死穴: Markdown標題係軟邊界,容易畀prompt injection攻擊。因為模型未必會將## Input。有保安研究員特別指出,唔應該用Markdown嚟分隔要分類嘅輸入內容,反而XML tag嘅明確開關結構令模型「冇咁易被呃」
。
XML tag用明確嘅開關標記,例如<instructions>、<schema>同<input>,將prompt唔同部分分開。Anthropic嘅官方指引明確推薦XML tag做複雜prompt嘅主要結構工具,話呢啲標籤創建咗明確嘅邊界,減低誤解機會 。
唔係永遠最好: 對於短而簡單嘅prompt,XML反而可能令準確率輕微下降。一個實測顯示,plain text prompt有97.6%準確率,XML就得96.4% — 只係細微嘅1.2個百分點懲罰,而且幻覺率無變 。同一測試仲顯示,XML會令輸入token增加31%
。XML嘅好處係隨prompt複雜度上升而增加,而唔係prompt質素:當prompt超過大約500個token、包含3個或以上邏輯段落嗰陣,XML先真正發揮作用
。
| 供應商 | 建議 |
|---|---|
| Anthropic (Claude) | 明確推薦XML tag畀複雜prompt;XML tag係主要結構工具 |
| OpenAI (GPT) | Playground建議用Markdown H1標題;嚴格邊界需要嗰陣用XML都得 |
| 業界普遍指引 | 複雜多段prompt同安全關鍵任務用XML;可讀性行先用Markdown |
例如你可以咁樣寫:
## Instructions
[你啲指令]
## Context
[背景資料]
## User Input
<UserInput>
[實際用戶輸入]
</UserInput>呢個模式兩邊都食到 — 人類睇得明嘅清楚標籤段落,加上圍住唔受信任部分嘅硬邊界。
Comments
0 comments