Til sammenligning: Det er 15 hjemmesider ud af cirka 1,1 milliarder på internettet, der kontrollerer mere end to tredjedele af, hvad AI-motorer anbefaler til milliarder af brugere hver dag . Denne koncentration er langt mere ekstrem end noget, Googles PageRank-algoritme producerede i sine 25 år som hersker over webfund
.
Disse domæner dukker konsekvent op i toppen af citeringsranglisterne hos ChatGPT, Google AI Mode, Gemini, Perplexity og AI Overviews:
Peec AIs analyse af 30 millioner kilder fandt, at de 10 mest citerede domæner på tværs af alle platforme var: Reddit, YouTube, LinkedIn, Wikipedia, Forbes, Facebook, Yelp, Amazon, TechRadar og Healthline .
Reddits brugergenererede diskussioner og fora giver et enormt, mangfoldigt datasæt af samtalebaseret og problemløsende indhold. I et Statista-studie fra juni 2025 stod Reddit for 40,1% af alle citerede referencer, langt foran andenpladsen Wikipedia med 26,3% . Hos Perplexity kan Reddit udgøre cirka hver femte citation
.
Analytikere peger på Reddits evne til at besvare nichesøgninger, meningsbaserede og 'how-to'-spørgsmål, som traditionelle encyklopædiske kilder har svært ved – hvilket gør platformen særligt værdifuld for samtalebaserede AI-modeller .
Selvom Reddit fører samlet set, afslører de individuelle motorrangeringer vigtige forskelle:
Kun 7 hjemmesider optræder blandt de 50 mest citerede domæner på tværs af alle tre store motorer (ChatGPT, Perplexity, Google AI Overviews), og kun 11% af domænerne citeres af både ChatGPT og Perplexity .
Det er vigtigt at adskille, hvad LLM'er citerer i deres output, fra hvad de er trænet på. Til træningsdata er den dominerende kilde i volumen Common Crawl – et åbent arkiv med petabyte af rå webdata, der fodrer modeller som GPT-3, LLaMA og T5 . OpenAIs GPT-3 hentede for eksempel 60% af sine træningstokens fra en filtreret version af Common Crawl
.
Citatlisterne ovenfor afspejler, hvad LLM'er refererer til, når de genererer svar – et meget mindre, mere kurateret sæt kilder, som modellen har lært at betragte som autoritative.
Hvis dit mål er at blive citeret af AI-motorer, er dataene klare: Du skal have en plads på den korte liste af betroede domæner. Den lange hale af internettet er stort set usynlig for de fleste AI-output uden for nichesøgninger.
Strategier, der virker, inkluderer at bidrage til Wikipedia, få omtale hos Forbes eller Healthline, opbygge en stærk tilstedeværelse på YouTube og LinkedIn og opnå citationer på Reddit. Formater, der øger citeringssuccesen, omfatter lister (cirka 50% af top-AI-citater) og sider med ordnede eller uordnede lister (til stede på 80% af AI-citerede sider) .
Kort sagt: Reddit, Wikipedia og YouTube er de tre mest citerede domæner på tværs af de store LLM-motorer i dag, med en lille klynge af autoritative medier, sundheds- og referencesider, der udgør toppen. At blive citeret af AI kræver først og fremmest at blive citeret af disse domæner.
Comments
0 comments