Luvut ovat karuja: 15 verkkosivustoa noin 1,1 miljardista internetissä olevasta sivustosta hallitsee yli kahta kolmasosaa siitä, mitä tekoälymoottorit suosittelevat miljardeille käyttäjille päivittäin . Tämä keskittyminen on paljon rajumpaa kuin Googlen PageRank-algoritmi tuotti 25-vuotisen verkkovallankumouksensa aikana
.
Nämä verkkotunnukset esiintyvät säännöllisesti kärjessä ChatGPT:n, Google AI Moden, Geminin, Perplexityn ja AI Overviewsin viittauslistoilla:
Peec AI:n analyysi 30 miljoonasta lähteestä paljasti, että kymmenen eniten viitattua verkkotunnusta kaikilla alustoilla ovat: Reddit, YouTube, LinkedIn, Wikipedia, Forbes, Facebook, Yelp, Amazon, TechRadar ja Healthline .
Redditin käyttäjien tuottamat keskustelut ja foorumit tarjoavat valtavan ja monipuolisen datamäärän keskustelu- ja ongelmanratkaisusisällöstä. Statistan kesäkuun 2025 tutkimuksessa Reddit sai 40,1 % kaikista viitatuista lähteistä, kaukana toisena tulevan Wikipedian 26,3 %:n edellä . Perplexityssä Reddit voi vastata noin joka viidennestä viittauksesta
.
Analyytikot korostavat Redditin kykyä vastata pitkäkestoisiin, mielipidepohjaisiin ja ohjeistaviin kysymyksiin, joiden käsittely perinteisillä ensyklopedisilla lähteillä on hankalaa – tämä tekee siitä erityisen arvokkaan keskusteleville tekoälyille .
Vaikka Reddit on kokonaiskärki, yksittäisten moottoreiden sijoitukset paljastavat tärkeitä eroja:
Vain 7 verkkosivustoa esiintyy 50 eniten viitatun verkkotunnuksen joukossa kaikissa kolmessa moottorissa (ChatGPT, Perplexity, Google AI Overviews), ja vain 11 %:lla verkkotunnuksista on viittauksia sekä ChatGPT:stä että Perplexitystä .
On tärkeää erottaa, mistä suuret kielimallit viittaavat tulosteissaan ja millä niitä on harjoitettu. Harjoitusdatan hallitseva lähde on Common Crawl – avoin tietovarasto, joka sisältää petatavuja raakaa verkkodataa ja jota hyödyntävät mallit kuten GPT-3, LLaMA ja T5 . Esimerkiksi OpenAI:n GPT-3 sai 60 % harjoitustokeneistaan suodatetusta Common Crawl -versiosta
.
Yllä olevat viittauslistat heijastavat sitä, mitä mallit viittaavat vastauksia tuottaessaan – paljon pienempää ja huolellisemmin valikoitua lähdejoukkoa, jonka malli on oppinut pitämään auktoritatiivisena.
Jos tavoitteesi on tulla tekoälyn viittaamaksi, data on selvää: sinun on ansaittava paikka lyhyellä listalla luotettuja verkkotunnuksia. Verkon pitkä häntä on käytännössä näkymätön useimmille tekoälytulosteille lukuun ottamatta kapeita kyselyjä.
Toimivia strategioita ovat muun muassa Wikipediaan kirjoittaminen, näkyvyyden hankkiminen Forbesilla tai Healthlinessa, vahvan YouTube- ja LinkedIn-läsnäolon rakentaminen ja viittausten ansaitseminen Redditissä. Tehosteellisia sisältömuotoja ovat listat (noin 50 % parhaista tekoälyviittauksista) ja sivut, joissa on järjestettyjä tai järjestämättömiä listoja (näitä on 80 %:lla tekoälyviitatuista sivuista) .
Lyhyesti: Reddit, Wikipedia ja YouTube ovat tänään kolme eniten viitattua verkkotunnusta suurissa kielimalleissa, ja pieni joukko auktoritatiivisia media-, terveys- ja hakuteossivustoja täydentää kärkikastia. Tekoälyviittauksen saaminen tarkoittaa käytännössä viittausten saamista näiltä sivustoilta.
Comments
0 comments