Bu rakamları bir perspektife oturtmak gerekirse: İnternetteki yaklaşık 1,1 milyar site arasından sadece 15 tanesi, yapay zeka motorlarının her gün milyarlarca kullanıcıya önerdiği bilgilerin üçte ikisinden fazlasını kontrol ediyor . Bu yoğunlaşma, Google'ın PageRank algoritmasının 25 yıllık web keşfi egemenliği sırasında ürettiğinden çok daha aşırı
.
Bu alan adları, ChatGPT, Google AI Mode, Gemini, Perplexity ve AI Overviews genelinde sürekli olarak en üst sıralarda yer alıyor:
Peec AI'nin 30 milyon kaynaklı analizi, tüm platformlar genelinde en çok atıf yapılan ilk 10 alan adını şöyle sıralıyor: Reddit, YouTube, LinkedIn, Wikipedia, Forbes, Facebook, Yelp, Amazon, TechRadar ve Healthline .
Reddit'in kullanıcı tarafından oluşturulan tartışmaları ve forumları, sohbet odaklı ve problem çözmeye yönelik geniş ve çeşitli bir veri seti sunuyor. Haziran 2025 tarihli bir Statista çalışmasında Reddit, atıfta bulunulan tüm referansların %40,1'ini alırken, ikinci sıradaki Wikipedia %26,3'te kaldı . Perplexity'de ise Reddit kabaca her 5 atıftan 1'ini oluşturabiliyor
.
Analistler, Reddit'in geleneksel ansiklopedik kaynakların zorlandığı 'uzun kuyruklu', fikre dayalı ve 'nasıl yapılır' türündeki soruları yanıtlama yeteneğine dikkat çekiyor. Bu durum, onu özellikle sohbet odaklı yapay zeka için değerli kılıyor .
Reddit genel liderliği elinde tutarken, bireysel motor sıralamaları önemli farklılıklar ortaya koyuyor:
Her üç büyük motorun (ChatGPT, Perplexity, Google AI Overviews) en çok atıf yapılan ilk 50 alan adı içinde yalnızca 7 web sitesi ortak olarak yer alıyor ve alan adlarının sadece %11'i hem ChatGPT hem de Perplexity tarafından atıf alıyor .
LLM'lerin çıktılarında atıfta bulundukları kaynaklarla, üzerinde eğitildikleri kaynakları birbirinden ayırmak önemli. Eğitim verileri söz konusu olduğunda, hacim olarak baskın kaynak Common Crawl'dır – GPT-3, LLaMA ve T5 gibi modelleri besleyen petabaytlarca ham web verisinden oluşan açık bir depo . Örneğin OpenAI'ın GPT-3'ü, eğitim tokenlerinin %60'ını Common Crawl'ın filtrelenmiş bir sürümünden almıştır
.
Yukarıdaki atıf listeleri, LLM'lerin yanıt üretirken başvurduğu kaynakları yansıtır – modelin güvenilir olarak ele almayı öğrendiği çok daha küçük ve daha seçkin bir kaynak kümesidir bu.
Hedefiniz yapay zeka motorları tarafından atıf almaksa veriler net: Güvenilen alan adlarının kısa listesinde yer almayı başarmalısınız. Web'in uzun kuyruğu, niş sorgular dışında çoğu yapay zeka çıktısı için işlevsel olarak görünmez durumda.
İşe yarayan stratejiler arasında Wikipedia'ya katkıda bulunmak, Forbes veya Healthline'da yer almak, güçlü bir YouTube ve LinkedIn varlığı oluşturmak ve Reddit'te atıf almak yer alıyor. Atıf başarısını artıran formatlar arasında listeleme yazıları (listicle'lar, en iyi yapay zeka atıflarının yaklaşık %50'sini oluşturuyor) ve sayfalarında sıralı veya sırasız listeler bulunan içerikler (yapay zeka tarafından atıf yapılan sayfaların %80'inde mevcut) bulunuyor .
Kısacası: Bugün büyük LLM motorlarında en çok atıf yapılan üç alan adı Reddit, Wikipedia ve YouTube'dur. Bunları, otoriter medya, sağlık ve referans sitelerinden oluşan küçük bir küme takip eder. Yapay zeka tarafından atıf almak, önce bu siteler tarafından atıf almaktan geçiyor.
Comments
0 comments