כדי לשים את זה בפרספקטיבה: 15 אתרים, מתוך כ-1.1 מיליארד אתרים באינטרנט, שולטים על יותר משני שלישים ממה שמנועי AI ממליצים עליו למליארדי משתמשים מדי יום . הריכוז הזה חמור בהרבה ממה שאלגוריתם PageRank של גוגל יצר אי פעם
.
אתרים אלה מופיעים באופן עקבי בצמרת דירוגי הציטוט ב-ChatGPT, Google AI Mode, Gemini, Perplexity ו-AI Overviews:
ניתוח 30 מיליון המקורות של Peec AI מצא ש-10 האתרים המצוטטים ביותר על פני כל הפלטפורמות הם: Reddit, YouTube, LinkedIn, Wikipedia, Forbes, Facebook, Yelp, Amazon, TechRadar ו-Healthline .
הדיונים והפורומים שנוצרים על ידי משתמשים ב-Reddit מספקים מאגר עצום ומגוון של תוכן שיחתי ופתרון בעיות. במחקר Statista מיוני 2025, Reddit תפסה 40.1% מכלל ההפניות המצוטטות, הרחק לפני ויקיפדיה במקום השני עם 26.3% . ב-Perplexity, Reddit יכולה להוות בערך 1 מתוך 5 ציטוטים
.
אנליסטים מצביעים על היכולת של Reddit לענות על שאלות 'זנב ארוך' (long-tail), מבוססות דעה ו'איך לעשות' שמקורות אנציקלופדיים מסורתיים מתקשים איתן – מה שהופך אותה לבעלת ערך מיוחד ל-AI שיחתי .
בעוד Reddit מובילה בסך הכל, דירוגי המנועים האישיים חושפים הבדלים חשובים:
רק 7 אתרים מופיעים ב-50 המצוטטים ביותר על פני שלושת המנועים הגדולים (ChatGPT, Perplexity, Google AI Overviews), ורק 11% מהאתרים מצוטטים על ידי גם ChatGPT וגם Perplexity .
חשוב להפריד בין מה ש-LLMs מצטטים בפלט שלהם לבין מה שהם מאומנים עליו. עבור נתוני אימון, המקור הדומיננטי מבחינת נפח הוא Common Crawl – מאגר פתוח של פטה-בייט של נתוני גלישה גולמיים שמזין מודלים כמו GPT-3, LLaMA ו-T5 . GPT-3 של OpenAI, לדוגמה, שאב 60% מאסימוני האימון שלו מגרסה מסוננת של Common Crawl
.
רשימות הציטוטים לעיל משקפות את מה ש-LLMs מתייחסים אליו בעת יצירת תגובות – קבוצה קטנה ומצומצמת הרבה יותר של מקורות שהמודל למד להתייחס אליהם כסמכותיים.
אם המטרה שלך היא להיות מצוטט על ידי מנועי AI, הנתונים ברורים: אתה צריך לזכות במקום ברשימה הקצרה של האתרים המהימנים. הזנב הארוך של הרשת כמעט בלתי נראה לרוב פלטי ה-AI, פרט לשאילתות נישה.
אסטרטגיות שעובדות כוללות תרומה לוויקיפדיה, קבלת סיקור ב-Forbes או ב-Healthline, בניית נוכחות חזקה ביוטיוב ובלינקדאין, וזכייה בציטוטים ב-Reddit. פורמטים שמגבירים את הצלחת הציטוטים כוללים רשימות (listicles) (שמהוות כ-50% מציטוטי ה-AI המובילים) ועמודים עם רשימות ממוספרות או לא ממוספרות (נמצאות על 80% מהעמודים המצוטטים על ידי AI) .
בקיצור: Reddit, ויקיפדיה ויוטיוב הם שלושת האתרים המצוטטים ביותר במנועי LLM הגדולים כיום, עם אשכול קטן של אתרי חדשות סמכותיים, בריאות ו-reference שמשלימים את השכבה העליונה. כדי להיצטט על ידי AI, צריך קודם כל להיצטט על ידי האתרים האלה.
Comments
0 comments