For å sette det i perspektiv: 15 nettsteder, av omtrent 1,1 milliarder på internett, kontrollerer mer enn to tredjedeler av hva AI-motorer anbefaler til milliarder av brukere hver dag . Denne konsentrasjonen er langt mer ekstrem enn noe Googles PageRank-algoritme produserte i løpet av sine 25 år med nettdiscovery
.
Disse domenene dukker konsekvent opp på toppen av siteringsrangeringer på tvers av ChatGPT, Google AI Mode, Gemini, Perplexity og AI Overviews:
Peec AIs analyse av 30 millioner kilder fant at de 10 mest siterte domenene på tvers av alle plattformer er: Reddit, YouTube, LinkedIn, Wikipedia, Forbes, Facebook, Yelp, Amazon, TechRadar og Healthline .
Reddits brukergenererte diskusjoner og forum gir et enormt og variert datasett med samtalebasert og problemløsende innhold. I en Statista-studie fra juni 2025 fanget Reddit 40,1 % av alle siterte referanser, langt foran Wikipedia på andreplass med 26,3 % . På Perplexity kan Reddit stå for omtrent 1 av 5 siteringer
.
Analytikere peker på Reddits evne til å svare på langhale-, meningsbaserte og «hvordan»-spørsmål som tradisjonelle encyklopediske kilder sliter med – noe som gjør det spesielt verdifullt for samtalebasert AI .
Mens Reddit leder totalt, avslører rangeringer for individuelle motorer viktige forskjeller:
Bare 7 nettsteder vises blant de 50 mest siterte domenene på tvers av alle tre store motorene (ChatGPT, Perplexity, Google AI Overviews), og bare 11 % av domenene siteres av både ChatGPT og Perplexity .
Det er viktig å skille mellom hva LLM-er siterer i sine svar og hva de er trent på. For treningsdata er den dominerende kilden etter volum Common Crawl – et åpent arkiv med petabyte med rå nettdata som mater modeller som GPT-3, LLaMA og T5 . OpenAIs GPT-3, for eksempel, hentet 60 % av treningstokenene sine fra en filtrert versjon av Common Crawl
.
Siteringslistene ovenfor gjenspeiler hva LLM-er refererer til når de genererer svar – et mye mindre, mer kuratert sett med kilder som modellen har lært å behandle som autoritative.
Hvis målet ditt er å bli sitert av AI-motorer, er dataene klare: du må tjene en plass på den korte listen over pålitelige domener. Langhalen av nettet er funksjonelt usynlig for de fleste AI-utdata utenom nisjesøk.
Strategier som fungerer inkluderer å bidra til Wikipedia, få dekning på Forbes eller Healthline, bygge en sterk tilstedeværelse på YouTube og LinkedIn, og tjene siteringer på Reddit. Formater som øker siteringssuksess inkluderer lister (som utgjør omtrent 50 % av topp AI-siteringer) og sider med ordnede eller uordnede lister (til stede på 80 % av AI-siterte sider) .
Kort oppsummert: Reddit, Wikipedia og YouTube er de tre mest siterte domenene på tvers av store LLM-motorer i dag, med en liten klynge av autoritative medier, helse- og referansesider som utgjør toppsjiktet. Å bli sitert av AI betyr først og fremst å bli sitert av disse domenene.
Comments
0 comments