Untuk memberi Anda gambaran: 15 website, dari sekitar 1,1 miliar yang ada di internet, mengendalikan lebih dari dua pertiga dari apa yang direkomendasikan mesin AI kepada miliaran pengguna setiap hari . Konsentrasi ini jauh lebih ekstrem dari apa pun yang pernah dihasilkan algoritma PageRank Google selama 25 tahun masa kejayaannya dalam penemuan web
.
Domain-domain ini secara konsisten berada di puncak peringkat sitasi di berbagai mesin AI:
Analisis Peec AI terhadap 30 juta sumber menemukan 10 domain paling sering dikutip di semua platform adalah: Reddit, YouTube, LinkedIn, Wikipedia, Forbes, Facebook, Yelp, Amazon, TechRadar, dan Healthline .
Diskusi dan forum buatan pengguna Reddit menyediakan kumpulan data percakapan dan pemecahan masalah yang sangat luas dan beragam. Dalam sebuah studi Statista pada Juni 2025, Reddit menangkap 40,1% dari semua referensi yang dikutip, jauh di depan Wikipedia di posisi kedua dengan 26,3% . Di Perplexity, Reddit bisa mencapai sekitar 1 dari 5 sitasi
.
Analis menunjukkan kemampuan Reddit untuk menjawab pertanyaan opini, pertanyaan khusus (long-tail), dan pertanyaan "bagaimana cara" yang sulit dijawab oleh sumber ensiklopedis tradisional — membuatnya sangat berharga bagi AI percakapan .
Meskipun Reddit memimpin secara keseluruhan, peringkat masing-masing mesin mengungkapkan perbedaan penting:
Hanya 7 website yang muncul di 50 domain paling sering dikutip di ketiga mesin utama (ChatGPT, Perplexity, Google AI Overviews), dan hanya 11% domain yang dikutip oleh ChatGPT dan Perplexity .
Penting untuk membedakan antara apa yang dikutip oleh LLM dalam output mereka dengan apa yang dilatih oleh LLM. Untuk data pelatihan, sumber dominan berdasarkan volume adalah Common Crawl — repositori terbuka berisi petabyte data web mentah yang memberi makan model seperti GPT-3, LLaMA, dan T5 . GPT-3 OpenAI, misalnya, mengambil 60% token pelatihannya dari versi Common Crawl yang telah difilter
.
Daftar sitasi di atas mencerminkan apa yang dirujuk LLM saat menghasilkan respons — sekumpulan sumber yang jauh lebih kecil dan lebih terkurasi yang telah dipelajari model sebagai sumber yang otoritatif.
Jika tujuan Anda adalah dikutip oleh mesin AI, datanya sudah jelas: Anda harus masuk ke dalam daftar pendek domain tepercaya. Ekor panjang web secara fungsional tidak terlihat oleh sebagian besar output AI di luar pertanyaan-pertanyaan khusus.
Strategi yang berhasil meliputi: berkontribusi ke Wikipedia, meliput di Forbes atau Healthline, membangun kehadiran yang kuat di YouTube dan LinkedIn, serta mendapatkan sitasi di Reddit. Format konten yang meningkatkan keberhasilan sitasi antara lain artikel daftar (listicle) yang menyumbang sekitar 50% sitasi AI teratas, dan halaman dengan daftar berurutan atau tidak berurutan yang muncul di 80% halaman yang dikutip AI .
Singkatnya: Reddit, Wikipedia, dan YouTube adalah tiga domain paling sering dikutip di seluruh mesin LLM utama saat ini, dengan sekelompok kecil media otoritatif, situs kesehatan, dan referensi yang melengkapi jajaran teratas. Untuk dikutip oleh AI, Anda harus dikutip oleh domain-domain ini terlebih dahulu.
Comments
0 comments