ידידותי לאנשים: Markdown מומלץ באופן נרחב להפיכת הוראות וקבצי הנחיה לברורים יותר גם לאנשים וגם למודלי AI . אופן-אייי עצמה מציעה ב-Playground שלה להשתמש ב-Markdown עם כותרות H1 ליצירת פרומפטים
.
החיסרון העיקרי: כותרות Markdown הן גבולות רכים. הן עלולות להיות פגיעות יותר להזרקת הוראות (prompt injection) מכיוון שהמודל לא תמיד מתייחס ל-## קלט. חוקר אבטחה אחד המליץ במפורש לא להשתמש ב-Markdown לתיחום קלט שצריך לסווג, וציין שהמודל "נוטה פחות להתבלבל" עם תגיות XML
.
תגיות בסגנון XML משתמשות בתוויות פתיחה-סגירה מפורשות כמו <instructions>, <schema> ו-<input> כדי להפריד בין חלקי ההוראה. ההנחיה הרשמית של אנתרופיק ממליצה במפורש על תגיות XML ככלי המבני העיקרי לפרומפטים מורכבים, ומציינת שהן יוצרות גבולות חד-משמעיים שמפחיתים טעויות בפרשנות .
יתרון אבטחה: XML מספק גבולות פתיחה-סגירה מפורשים, מה שמקשה על תוכן מוזרק לחלחל בין חלקים . לעומת זאת, ההנחיה גורסת שתגיות XML עדיפות על כותרות Markdown להפרדת הוראות, דוגמאות, נתוני עזר ושאלות משתמש
.
לא תמיד טוב יותר: עבור הוראות קצרות ופשוטות, XML יכול דווקא להפחית מעט את הדיוק. בדיקה אחת הראתה דיוק של 97.6% להוראות שטוחות לעומת 96.4% ל-XML – עונש קל של 1.2 נקודת אחוז, ללא שינוי בשיעור ההזיות . אותה בדיקה הראתה גידול של 31% בעלויות טוקני קלט עם XML
. התועלת של XML עולה עם מורכבות ההוראה, לא עם איכות התוכן: היא מסייעת כשההוראה עולה על כ-500 טוקנים ויש בה 3 חלקים לוגיים או יותר
.
כל שלושת הספקים הגדולים ממליצים על XML כתבנית תיחום אפקטיבית, אבל אין צורך ב-XML פורמלי ומחמיר – הכוונה הסמנטית היא מה שחשוב .
מתרגלים רבים משתמשים בשילוב: כותרות Markdown למבנה הכללי, בתוספת תגיות XML או גדרות קוד סביב בלוקים של קלט משתמש . גישה זו משלבת את הקריאות של Markdown עם גבולות האבטחה של XML.
לדוגמה, תוכלו להשתמש ב:
## הוראות
[ההוראות שלכם כאן]
## הקשר
[מידע רקע]
## קלט משתמש
<UserInput>
[קלט המשתמש בפועל]
</UserInput>תבנית זו נותנת לכם את הטוב משני העולמות – חלקים מסומנים בבירור שקל לאנשים לקרוא, בתוספת גבולות נוקשים סביב החלק הלא-מהימן של ההוראה.
השתמשו ב-Markdown לרוב הפרומפטים היומיומיים כי הוא קריא, חסכוני בטוקנים ומתפקד היטב בהשוואות פורמטים מתועדות . עברו לתגיות XML כשיש לכם הוראות מורכבות ורבות-חלקים, כשאתם זקוקים לגבולות סמנטיים נוקשים למען האבטחה, או כשאתם עובדים עם Claude
. יעילות הפורמט תלויה גם במודל ה-AI – נוחות התחזוקה מבחינת המפתח האנושי חשובה לא פחות מביצועי המודל
.
Comments
0 comments