Lidsky přívětivý: Markdown se běžně doporučuje pro tvorbu promptů a instrukcí, aby byly srozumitelnější jak pro lidi, tak pro modely umělé inteligence . Prostředí OpenAI Playground dokonce pro generování promptů navrhuje používat Markdown s nadpisy H1
.
Hlavní nevýhoda: Markdown nadpisy jsou měkčí hranice. Jsou zranitelnější vůči prompt injection, protože model ## Vstup. Jeden bezpečnostní expert konkrétně varoval před používáním Markdownu pro oddělování vstupu, který má být klasifikován, a poznamenal, že u XML tagů je model „méně náchylný k oklamání“
.
XML tagy používají explicitní otevírací a uzavírací značky jako <instrukce>, <schema> a <vstup>, které oddělují jednotlivé sekce promptu. Oficiální pokyny od Anthropicu (tvůrce modelu Claude) výslovně doporučují XML tagy jako primární nástroj pro strukturování složitých promptů, protože vytvářejí jednoznačné hranice, které snižují riziko chybné interpretace .
Bezpečnostní výhoda: XML poskytuje explicitní otevírací a uzavírací hranice, což ztěžuje „prosakování“ vloženého obsahu mezi sekcemi . U „AI agentů“ podle některých zdrojů XML tagy překonávají Markdown nadpisy při oddělování instrukcí, příkladů, referenčních dat a uživatelských otázek
.
Ne vždy lepší: U krátkých, jednoduchých promptů může XML přesnost mírně snížit. Jeden test ukázal přesnost prostého promptu 97,6 % oproti 96,4 % u XML – malá ztráta 1,2 procentního bodu bez změny míry halucinací . Stejný test ukázal 31% nárůst režie vstupních tokenů při použití XML
. Výhoda XML roste se složitostí promptu, nikoli s jeho kvalitou: pomáhá, když prompt přesahuje zhruba 500 tokenů a obsahuje 3 a více logických sekcí
.
Všichni tři hlavní výrobci doporučují XML jako efektivní vzor pro oddělovače, ale formální XML není nutné – důležitý je sémantický záměr .
Mnoho praktiků používá hybrid: Markdown nadpisy pro celkovou strukturu a k tomu XML tagy nebo „code fences“ kolem bloků uživatelského vstupu . Tento přístup kombinuje čitelnost Markdownu s bezpečnostními hranicemi XML.
Příklad takové kombinace:
## Instrukce
[Vaše instrukce]
## Kontext
[Základní informace]
## Uživatelský vstup
<UzivatelskyVstup>
[skutečný uživatelský vstup]
</UzivatelskyVstup>Tento vzor poskytuje to nejlepší z obou světů – přehledně označené sekce, kterým lidé snadno rozumějí, a zároveň pevné hranice kolem nedůvěryhodné části promptu.
Používejte Markdown pro většinu každodenního promptování, protože je čitelný, úsporný na tokenech a v dokumentovaných srovnáních podává dobré výsledky . Přejděte na XML tagy, pokud máte složité, vícedílné prompty, potřebujete pevné sémantické hranice z bezpečnostních důvodů nebo pracujete s modelem Claude
. Účinnost formátu závisí také na modelu – udržitelnost z lidské strany je stejně důležitá jako výkon modelu
.
Comments
0 comments