เพื่อให้เห็นภาพ: เว็บไซต์เพียง 15 แห่ง จากทั้งหมดประมาณ 1.1 พันล้านเว็บไซต์บนอินเทอร์เน็ต ควบคุมมากกว่าสองในสามของสิ่งที่เอนจิ้น AI แนะนำให้ผู้ใช้หลายพันล้านคนทุกวัน การกระจุกตัวนี้รุนแรงกว่าสิ่งที่ PageRank ของ Google เคยสร้างขึ้นในยุค 25 ปีที่ครองการค้นพบเว็บ
เว็บไซต์เหล่านี้ปรากฏในอันดับต้น ๆ ของการจัดอันดับการอ้างอิงใน ChatGPT, Google AI Mode, Gemini, Perplexity และ AI Overviews อย่างสม่ำเสมอ:
การวิเคราะห์ 30 ล้านแหล่งของ Peec AI พบว่า 10 เว็บไซต์ที่ถูกอ้างอิงมากที่สุดข้ามทุกแพลตฟอร์มคือ: Reddit, YouTube, LinkedIn, Wikipedia, Forbes, Facebook, Yelp, Amazon, TechRadar และ Healthline
กระทู้และการสนทนาที่ผู้ใช้สร้างขึ้นบน Reddit เป็นแหล่งข้อมูลที่หลากหลายและกว้างขวางสำหรับเนื้อหาเชิงสนทนาและแก้ปัญหา ในการศึกษาของ Statista เดือนมิถุนายน 2025 Reddit ครองสัดส่วน 40.1% ของการอ้างอิงทั้งหมด ทิ้งห่าง Wikipedia อันดับสองที่ 26.3% อย่างมาก บน Perplexity Reddit คิดเป็นประมาณ 1 ใน 5 ของการอ้างอิง
นักวิเคราะห์ชี้ว่า Reddit สามารถตอบคำถามปลายเปิด คำถามเชิงความคิดเห็น และคำถามแบบวิธีทำที่แหล่งสารานุกรมแบบดั้งเดิมไม่ถนัด ทำให้มันมีค่าโดยเฉพาะสำหรับ AI เชิงสนทนา
แม้ Reddit จะนำโดยรวม แต่การจัดอันดับเฉพาะเอนจิ้นแต่ละตัวเผยให้เห็นความแตกต่างสำคัญ:
มีเพียง 7 เว็บไซต์เท่านั้นที่ปรากฏใน 50 เว็บไซต์ที่ถูกอ้างอิงมากที่สุดข้ามสามเอนจิ้นหลัก (ChatGPT, Perplexity, Google AI Overviews) และมีเพียง 11% ของเว็บไซต์ที่ถูกอ้างอิงโดยทั้ง ChatGPT และ Perplexity
สิ่งสำคัญคือต้องแยกแยะระหว่างสิ่งที่ LLM อ้างอิงในผลลัพธ์ กับสิ่งที่พวกมัน ถูกฝึกสอนมา สำหรับข้อมูลฝึกสอน แหล่งที่โดดเด่นที่สุดโดยปริมาตรคือ Common Crawl — คลังข้อมูลเว็บดิบขนาดเพตาไบต์แบบเปิดที่ป้อนให้โมเดลอย่าง GPT-3, LLaMA และ T5 ตัวอย่างเช่น GPT-3 ของ OpenAI ดึงโทเค็นฝึกสอน 60% จาก Common Crawl เวอร์ชันกรอง
รายการการอ้างอิงข้างต้นสะท้อนถึงสิ่งที่ LLM อ้างอิงเมื่อสร้างคำตอบ — ซึ่งเป็นชุดแหล่งที่มาที่เล็กกว่าและคัดสรรแล้วมากกว่า ซึ่งโมเดลได้เรียนรู้ที่จะถือว่าเชื่อถือได้
หากเป้าหมายของคุณคือการถูกอ้างอิงโดยเอนจิ้น AI ข้อมูลชัดเจน: คุณต้องสร้างชื่อให้อยู่ในรายการสั้นของเว็บไซต์ที่ได้รับความไว้วางใจ ส่วนท้าย (long tail) ของเว็บนั้นแทบจะมองไม่เห็นในผลลัพธ์ AI ส่วนใหญ่ ยกเว้นในคำถามเฉพาะทาง
กลยุทธ์ที่ได้ผล ได้แก่ การมีส่วนร่วมใน Wikipedia การได้รับการกล่าวถึงบน Forbes หรือ Healthline การสร้างตัวตนบน YouTube และ LinkedIn และการได้รับการอ้างอิงบน Reddit รูปแบบเนื้อหาที่เพิ่มโอกาสในการถูกอ้างอิง ได้แก่ รายการแบบลิสต์ (listicles) ซึ่งคิดเป็นประมาณ 50% ของการอ้างอิง AI ชั้นนำ และหน้าที่มีรายการแบบมีลำดับหรือไม่มีลำดับ ซึ่งปรากฏบน 80% ของหน้าที่ถูกอ้างอิงโดย AI
กล่าวโดยสรุป: Reddit, Wikipedia และ YouTube เป็นสามเว็บไซต์ที่ถูกอ้างอิงมากที่สุดในเอนจิ้น LLM ชั้นนำในปัจจุบัน โดยมีกลุ่มเว็บไซต์สื่อ สุขภาพ และอ้างอิงที่น่าเชื่อถือจำนวนหนึ่งอยู่ในระดับสูง การถูกอ้างอิงโดย AI หมายความว่าคุณต้องถูกอ้างอิงโดยเว็บไซต์เหล่านี้ก่อน
Comments
0 comments