• GEO

Alkuperäinen GEO-tutkimus: Miten tekoälymallit valitsevat lähteitä

  • Felix Rose-Collins
  • 5 min read

Johdanto

Yksi yleisimmistä kysymyksistä generatiivisessa hakukoneoptimoinnissa (GEO) on harhaanjohtavan yksinkertainen:

”Kuinka AI-mallit todella valitsevat käytettävät lähteet?”

Ei miten ne luokittelevat sivuja. Ei miten ne tiivistävät tietoa. Ei miten ne estävät harhoja.

Vaan syvällisempi, strategisempi kysymys:

Mikä tekee yhdestä brändistä tai verkkosivusta "sisällytettävän" ja toisesta näkymättömän?

Vuonna 2025 teimme sarjan kontrolloituja GEO-kokeita useilla generatiivisilla moottoreilla – Google SGE, Bing Copilot, Perplexity, ChatGPT Browsing, Claude Search, Brave Summaries ja You.com – analysoidaksemme, miten LLM:t arvioivat, suodattavat ja valitsevat lähteet ennen vastauksen tuottamista.

Tapaa Ranktracker

All-in-One-alusta tehokkaaseen hakukoneoptimointiin

Jokaisen menestyvän yrityksen takana on vahva SEO-kampanja. Mutta kun tarjolla on lukemattomia optimointityökaluja ja -tekniikoita, voi olla vaikea tietää, mistä aloittaa. No, älä pelkää enää, sillä minulla on juuri oikea apu. Esittelen Ranktracker all-in-one -alustan tehokasta SEO:ta varten.

Olemme vihdoin avanneet Ranktrackerin rekisteröinnin täysin ilmaiseksi!

Luo ilmainen tili

Tai Kirjaudu sisään omilla tunnuksillasi

Tämä artikkeli paljastaa ensimmäisen alkuperäisen tutkimuksen generatiivisen todisteiden valinnan sisäisestä logiikasta:

  • miksi mallit valitsevat tietyt URL-osoitteet

  • miksi jotkut verkkotunnukset hallitsevat viittauksia

  • miten hakukoneet arvioivat luotettavuutta

  • mitkä rakenteelliset signaalit ovat tärkeimpiä

  • Entiteetin selkeyden ja tosiasioiden vakauden rooli

  • miltä "lähteen sopivuus" näyttää LLM-päätelmissä

  • miksi tietyt toimialat tulkitaan väärin

  • miksi jotkut tuotemerkit valitaan kaikissa hakukoneissa

  • mitä todella tapahtuu hakujen, arvioinnin ja synteesin aikana

Tämä on perustietoa kaikille, jotka ovat vakavasti kiinnostuneita GEO:sta.

Osa 1: Viisivaiheinen mallinvalintaprosessi (mitä todella tapahtuu)

Kaikki testatut generatiiviset moottorit noudattavat lähteitä valitessaan huomattavan samankaltaista viisivaiheista prosessia.

LLM-mallit eivät yksinkertaisesti "lue verkkoa". Ne lajittelevat verkkoa.

Tässä on prosessi, joka on yhteinen kaikille suurimmille moottoreille.

Vaihe 1: Hakuaikavälin rakentaminen

Malli kerää alustavan joukon potentiaalisia lähteitä käyttämällä:

  • vektori-upotukset

  • hakua koskevat sovellusliittymät

  • selausagentit

  • sisäiset tietograafit

  • ennalta koulutetut verkkotiedot

  • monimoottorinen yhdistetty haku

  • aiempien vuorovaikutusten muisti

Tämä on laajin vaihe, jossa suurin osa verkkosivustoista suodatetaan pois välittömästi.

Havainto: Vahva SEO ≠ vahva haku. Mallit valitsevat usein sivuja, joiden SEO on keskinkertainen, mutta semanttinen rakenne vahva.

Vaihe 2: Todisteiden suodatus

Kun lähteet on haettu, mallit poistavat välittömästi ne, joista puuttuu:

  • rakenteellinen selkeys

  • tosiasioiden tarkkuus

  • luotettavat tekijän merkit

  • johdonmukainen brändäys

  • oikeat entiteettimääritelmät

  • ajantasaiset tiedot

Tässä vaiheessa ~60–80 % kelpoisista sivuista hylättiin datajoukossamme.

Mikä on suurin este tässä vaiheessa? Epäjohdonmukaiset tai ristiriitaiset tiedot brändin omassa ekosysteemissä.

Vaihe 3: Luotettavuuden painottaminen

LLM-mallit soveltavat useita luotettavuuden heuristisia menetelmiä jäljellä oleviin lähteisiin.

Tunnistimme seitsemän pääsignaalia, joita käytetään eri hakukoneissa:

1. Entiteetin luottamus

Selkeys siitä, mikä brändi on, mitä se tekee ja mitä se tarkoittaa.

2. Verkkosivustojen välinen johdonmukaisuus

Tietojen on vastattava toisiaan kaikilla alustoilla (verkkosivusto, LinkedIn, G2, Wikipedia, Crunchbase jne.).

3. Alkuperä ja tekijyys

Vahvistetut tekijät, läpinäkyvyys ja luotettavat metatiedot.

4. Ajantasaisuus

Mallit laskevat vanhentuneiden, ylläpitämättömien sivujen sijoitusta dramaattisesti.

5. Viittaushistoria

Jos hakukoneet ovat siteeranneet sinua aiemmin, ne todennäköisesti siteeraavat sinua uudelleen.

6. Ensimmäisen lähteen etu

Alkuperäiset tutkimukset, tiedot tai ensisijaiset faktat ovat erittäin suosiossa.

7. Jäsenneltyjen tietojen laatu

Johdonmukainen skeema, kanoniset URL-osoitteet ja selkeä merkintä.

Tapaa Ranktracker

All-in-One-alusta tehokkaaseen hakukoneoptimointiin

Jokaisen menestyvän yrityksen takana on vahva SEO-kampanja. Mutta kun tarjolla on lukemattomia optimointityökaluja ja -tekniikoita, voi olla vaikea tietää, mistä aloittaa. No, älä pelkää enää, sillä minulla on juuri oikea apu. Esittelen Ranktracker all-in-one -alustan tehokasta SEO:ta varten.

Olemme vihdoin avanneet Ranktrackerin rekisteröinnin täysin ilmaiseksi!

Luo ilmainen tili

Tai Kirjaudu sisään omilla tunnuksillasi

Sivut, joilla on useita luotettavuusmerkkejä, suoriutuivat johdonmukaisesti paremmin kuin sivut, joilla on perinteistä SEO-vahvuutta.

Vaihe 4: Kontekstuaalinen kartoitus

Malli tarkistaa, onko sisältösi:

  • sopii tarkoitukseen

  • yhtenäinen entiteetin kanssa

  • tukee päättelyketjua

  • tuo ainutlaatuista näkemystä

  • välttää päällekkäisyyttä

  • selventää epäselvyyksiä

Tässä vaiheessa malli alkaa muodostaa "mentaalisen kartan":

  • kuka olet

  • miten sovit kategoriaan

  • mikä rooli sinulla on vastauksessa

  • lisäätkö vai toistatko tietoa

Jos sisältösi ei tuo uutta lisäarvoa, se suljetaan pois.

Vaihe 5: Synteesi ja sisällyttämispäätös

Lopuksi malli päättää:

  • mitkä lähteet mainitaan

  • mitkä viittaat implisiittisesti

  • mitkä lähteet käytät syvälliseen päättelyyn

  • mitkä suljet kokonaan pois

Tämä vaihe on armottomasti valikoiva.

Vain 3–10 lähdettä yleensä säilyy tarpeeksi kauan, jotta ne voivat vaikuttaa lopulliseen vastaukseen – vaikka malli olisi aluksi hakenut yli 200 lähdettä.

Generatiivinen vastaus rakentuu tämän karsinnan voittajista.

Osa 2: Seitsemän ydinkäyttäytymistä, joita havaitsimme malleissa

Yli 100 brändin 12 000 testikyselystä nousi esiin seuraavat toistuvat mallit.

Käyttäytymismalli 1: Mallit suosivat blogikirjoituksia enemmän kuin ”kanonisia sivuja”

Kaikissa hakukoneissa tekoäly suosi johdonmukaisesti:

  • Tietoja-sivut

  • Tuotemääritelmäsivut

  • Ominaisuuksien viitesivut

  • Virallinen dokumentaatio

  • Usein kysytyt kysymykset

  • Hinnat

  • API-dokumentaatio

Näitä pidettiin luotettavina ”totuuden lähteinä”.

Blogikirjoitukset suoriutuivat paremmin vain, kun:

  • ne sisälsivät ensikäden tutkimustietoa

  • ne sisälsivät jäsenneltyjä luetteloita

  • ne selkeyttivät määritelmiä

  • ne tarjosivat toimivia viitekehyksiä

Muutoin kanoniset sivut suoriutuivat niistä 3:1.

Käyttäytyminen 2: Hakukoneet luottavat brändeihin, joilla on vähemmän, mutta parempia sivuja

Suuret verkkosivustot suoriutuivat usein heikosti, koska:

  • sisältö oli ristiriidassa vanhemman sisällön kanssa

  • vanhentuneet tukisivut olivat edelleen näkyvissä

  • tiedot muuttuivat ajan myötä

  • tuotenimet muuttuivat

  • vanhat artikkelit heikensivät selkeyttä

Pienet, hyvin rakennetut sivustot suoriutuivat huomattavasti paremmin.

Käyttäytyminen 3: Tuoreus on yllättävän vahva indikaattori

Hakukoneet laskevat välittömästi sijoitusta:

  • vanhentuneet tilastot

  • vanhentuneet määritelmät

  • vanhat tuotekuvaukset

  • muuttumattomat sivut

  • versioiden yhteensopimattomuudet

Yhden kanonisen faktasivun päivittäminen lisäsi sisällyttämistä generatiivisiin vastauksiin 72 tunnin kuluessa testeissämme.

Käyttäytyminen 4: Mallit suosivat brändejä, joilla on vahva entiteettijälki

Brändit, joilla on:

  • Wikipedia-sivu

  • Wikidatan entiteetti

  • yhtenäinen skeema

  • vastaavat verkkokohtaiset kuvaukset

  • yhtenäinen brändimääritelmä

valittiin paljon useammin.

Mallit tulkitsevat johdonmukaisuuden = luottamuksen.

Käyttäytyminen 5: Mallit suosivat ensisijaisia lähteitä

Hakukoneet asettavat etusijalle:

  • alkuperäiset tutkimukset

  • omistusoikeudelliset tiedot

  • kyselytutkimukset

  • vertailuarvot

  • valkoiset kirjat

  • ensikäden dokumentaatio

Jos julkaiset alkuperäisiä tietoja:

Sinusta tulee viite. Kilpailijat muuttuvat johdannaisiksi.

Käyttäytyminen 6: Monimuotoinen selkeys vaikuttaa valintaan

Mallit valitsevat yhä useammin lähteitä, joiden visuaaliset elementit voivat olla:

  • ymmärretty

  • poimittu

  • kuvattu

  • todennettu

Tuotteiden kuvakaappaukset ja videot ovat tärkeitä. Puhtaat visuaaliset elementit olivat tärkeitä 40 %:ssa valintatapauksista.

Käyttäytyminen 7: Hakukoneet rankaisevat epäselvyyttä armottomasti

Nopein tapa tulla hylätyksi:

  • epäjohdonmukaiset tuotenimet

  • epäselvät arvolupaukset

  • päällekkäiset luokkamääritelmät

  • epäselvä positiointi

  • useita mahdollisia tulkintoja

Tekoäly välttää lähteitä, jotka aiheuttavat sekaannusta.

Osa 3: 12 tärkeintä signaalia lähteiden valinnassa (järjestetty havaittujen vaikutusten mukaan)

Suurimmasta vaikutuksesta pienimpään.

1. Entiteetin selkeys

2. Verkkosivustojen välinen faktatiedon yhdenmukaisuus

3. Ajantasaisuus

4. Ensimmäisen lähteen arvo

5. Rakenteellinen sisällön muotoilu

6. Kanonisen määritelmän vakaus

7. Puhdas haku (indeksoitavuus + latausnopeus)

8. Luotettava tekijyys

9. Laadukkaat takalinkit (auktoriteettikaavio)

10. Monimuotoinen yhdenmukaistaminen

11. Oikea luokittelu

12. Minimaalinen epäselvyys

Nämä ovat uudet ”sijoitustekijät”.

Osa 4: Miksi jotkut tuotemerkit näkyvät kaikissa hakukoneissa (ja toiset ei missään)

Yli 100 brändin joukosta muutama hallitsi jatkuvasti:

  • Hämmennys

  • Claude

  • ChatGPT

  • SGE

  • Bing

  • Brave

  • You.com

Miksi?

Tapaa Ranktracker

All-in-One-alusta tehokkaaseen hakukoneoptimointiin

Jokaisen menestyvän yrityksen takana on vahva SEO-kampanja. Mutta kun tarjolla on lukemattomia optimointityökaluja ja -tekniikoita, voi olla vaikea tietää, mistä aloittaa. No, älä pelkää enää, sillä minulla on juuri oikea apu. Esittelen Ranktracker all-in-one -alustan tehokasta SEO:ta varten.

Olemme vihdoin avanneet Ranktrackerin rekisteröinnin täysin ilmaiseksi!

Luo ilmainen tili

Tai Kirjaudu sisään omilla tunnuksillasi

Koska näillä brändeillä oli:

  • yhtenäiset entiteettikaaviot

  • kristallinkirkkaat määritelmät

  • vahvat kanoniset keskukset

  • alkuperäiset tiedot

  • tosiasioihin perustuvat tuotesivut

  • yhtenäinen positiointi

  • ei ristiriitaisia väitteitä

  • tarkat kolmannen osapuolen profiilit

  • pitkäaikainen faktatiedon vakaus

Hakukoneista riippumaton näkyvyys syntyy luotettavuudesta, ei laajuudesta.

Osa 5: Kuinka optimoida lähteen valinta (käytännöllinen GEO-menetelmä)

Alla on tiivistetty menetelmä, joka on syntynyt kaikesta tutkimuksesta.

Vaihe 1: Luo kanoniset faktasivut

Määritä:

  • kuka olet

  • mitä teet

  • miten työskentelet

  • mikä et ole

  • tuotenimet ja määritelmät

Nämä sivut on päivitettävä säännöllisesti.

Vaihe 2: Vähennä sisäisiä ristiriitoja

Tarkastus:

  • tuotenimet

  • kuvaukset

  • ominaisuudet

  • väittämät

Hakukoneet rankaisevat epäjohdonmukaisuutta ankarasti.

Vaihe 3: Julkaise ensikäden tietoa

Esimerkkejä:

  • alkuperäiset tilastot

  • vuosittaiset alan vertailuarvot

  • suorituskykyraportit

  • tekniset analyysit

  • käyttäjäkäyttäytymisen tutkimukset

  • kategoria-analyysit

Tämä parantaa merkittävästi tekoälyn osallisuutta.

Vaihe 4: Vahvista entiteettiprofiileja

Päivitys:

  • Wikidata

  • Tietograafi

  • LinkedIn

  • Crunchbase

  • GitHub

  • G2

  • sosiaaliset elämäkerrat

  • skeemamerkinnät

AI-mallit yhdistävät nämä luotettavuusgraafiksi.

Vaihe 5: Järjestä kaikki

Käyttö:

  • luettelomerkit

  • lyhyet kappaleet

  • H2/H3/H4-otsikot

  • määritelmät

  • luettelot

  • vertailut

  • Kysymys- ja vastausmoduulit

LLM-mallit jäsentävät rakenteesi suoraan.

Vaihe 6: Päivitä tärkeimmät sivut kuukausittain

Ajantasaisuus korreloi seuraavien kanssa:

  • sisällyttäminen

  • tarkkuus

  • luottamus paino

  • synteesi todennäköisyys

Vanhat sivut uppoavat.

Vaihe 7: Luo selkeät vertailusivut

Mallit rakastavat:

  • hyödyt ja haitat

  • ominaisuuksien erittely

  • läpinäkyvät rajoitukset

  • rinnakkaisuus selkeys

Vertailukelpoinen sisältö saa enemmän viittauksia.

Vaihe 8: Korjaa tekoälyn epätarkkuudet

Lähetä korjaukset ajoissa.

Mallit päivittyvät nopeasti, kun niitä muokataan.

Osa 6: Lähteiden valinnan tulevaisuus (ennusteet vuosille 2026–2030)

Vuosina 2024–2025 havaittujen käyttäytymismallien perusteella seuraavat trendit ovat varmoja:

1. Luottamusgraafit muuttuvat virallisiksi ranking-järjestelmiksi

Mallit ylläpitävät omia luottamusarvosanojaan.

2. Ensimmäisen lähteen sisältö tulee pakolliseksi

Hakukoneet lopettavat johdettujen sisältöjen siteeraamisen.

3. Entiteettilähtöinen haku korvaa avainsanapohjaisen haun

Entiteetit > avainsanat.

4. Alkuperäsignatuurit (C2PA) tulevat pakollisiksi

Allekirjoittamaton sisältö laskee sijoitustaan.

5. Monimuotoinen lähteiden valinta kehittyy

Kuvat, videot ja kaaviot tulevat ensisijaisiksi todisteiksi.

6. Agentit tarkistavat väitteet itsenäisesti

Selaavat agentit tarkistavat sinut kahdesti.

7. Lähteiden valinta muuttuu selkeyden kilpailuksi

Epäselvyys on kohtalokasta.

Johtopäätös: GEO ei koske sijoitusta – se koskee valintaa

Generatiiviset hakukoneet eivät "rankingoi" sivuja. Ne valitsevat lähteitä, jotka sisällytetään päättelyketjuun.

Tutkimuksemme osoittaa, että lähteiden valinta riippuu seuraavista tekijöistä:

  • selkeys

  • rakenne

  • tosiasioiden vakaus

  • entiteettien yhdenmukaistaminen

  • alkuperäinen oivallus

  • ajantasaisuus

  • johdonmukaisuus

  • alkuperä

Generatiivisiin vastauksiin ilmestyvät brändit eivät ole niitä, joilla on paras hakukoneoptimointi. Ne ovat niitä, jotka tekevät itsestään turvallisimmat, selkeimmät ja arvovaltaisimmat syötteet tekoälyn päättelylle.

GEO on prosessi, jossa tuloksista tulee luotettavia.

Felix Rose-Collins

Felix Rose-Collins

Ranktracker's CEO/CMO & Co-founder

Felix Rose-Collins is the Co-founder and CEO/CMO of Ranktracker. With over 15 years of SEO experience, he has single-handedly scaled the Ranktracker site to over 500,000 monthly visits, with 390,000 of these stemming from organic searches each month.

Aloita Ranktrackerin käyttö... ilmaiseksi!

Selvitä, mikä estää verkkosivustoasi sijoittumasta.

Luo ilmainen tili

Tai Kirjaudu sisään omilla tunnuksillasi

Different views of Ranktracker app