Internasjonal markedsføring

Foretrekker LLM-er Wikipedia? Vi analyserte 6844 sitater fra Claude, Gemini og GPT for å finne det ut.

Foretrekker LLM-er Wikipedia? Vi analyserte 6844 sitater fra Claude, Gemini og GPT for å finne det ut.
Rayne Aguilar
Skrevet av
Rayne Aguilar
Elizabeth Pokorny
Gjennomgått av
Elizabeth Pokorny
Oppdatert
2. juni 2026

Dette er en ny studie i vår serie om å undersøke AI-atferd i flerspråklige markeder.

I lang tid, og til akademikernes store forferdelse (kan noen fortsatt høre «INGEN BRUK AV WIKIPEDIA» ringe i bakhodet?), har Wikipedia blitt behandlet som standard kunnskapskilde. Den er åpen, strukturert og enda bedre – flerspråklig og kontinuerlig oppdatert. Noe som på papiret også gjør den til den perfekte siteringskandidaten for store språkmodeller (LLM-er).

Derfor er det, sammen med Reddit, en av de mest innflytelsesrike kildene for LLM-er. Men gitt Wikipedias crowdsourcing-natur, er den utsatt for redigering av negativ eller utdatert informasjon, noe som også kan finne veien inn i AI-søk .

Så det er ingen overraskelse at den vanlige antagelsen er at Wikipedia har formet det geografiske landskapet . Optimaliser for det Wikipedia dekker, og bli sitert der Wikipedia blir sitert.

Men dataene våre forteller en annen historie.

Vi vet allerede at det å ikke oversette nettstedet ditt betyr at du er usynlig . Men endrer det ting i din favør å ha en Wikipedia-side for bedriften?

Vi undersøkte hvor ofte de tre ledende AI-modellene siterer Wikipedia, på hvilke språk, og hva de siterer i stedet. Resultatene utfordrer oppfatningen om at Wikipedia er konge, og avslører noe mer nyttig for ethvert merke som tenker på AI-synlighet i internasjonale markeder: LLM-er jakter aktivt etter kilder med høy autoritet, som er oversatt til sitt eget språk . Når de finner dem, siterer de dem. Når de ikke gjør det, faller de tilbake til engelsk.

Oppsettet

Vi analyserte hvordan Claude Haiku 4.5, Gemini 3.1 Flash og GPT 5.4 Mini siterer kilder på tvers av 750 spørringer.

Spørsmålene ble bygget fra 15 Wikipedia-sider per språkkombinasjon: emner kun på engelsk, fransk-engelsk, spansk-engelsk og japansk-engelsk. Fem spørringer ble generert per side, og deretter ble engelskspråklige spørringer oversatt til de tre målspråkene for å teste hvordan siteringsatferd endres når det samme spørsmålet stilles på et annet språk. Det resulterte i totalt 750 spørsmål, som hver ble kjørt gjennom alle tre modellene, noe som ga oss 2250 individuelle modellsvar å analysere.

Hver prompt ba modellen eksplisitt om å oppgi siterte kilde-URL-er og flagge når den svarte fra sin egen kunnskap i stedet. Modellsvarene ble deretter matchet mot det relevante Wikipedia-domenet (engelsk eller målspråket) for å måle hvor ofte Wikipedia selv ble sitert, og hvilke domener som dukket opp i stedet.

Merk: I tidlig testing svarte Claude på engelske spørsmål fra sine egne treningsdata uten å dukke opp kilder. Spørsmålene ble justert for å eksplisitt be om sitater på tvers av alle modeller. Selv etter denne justeringen fortsatte Claude å flagge «egen kunnskap»-svar i uvanlig høy grad på emner kun på engelsk, noe vi kommer tilbake til.

Funn 1: Wikipedia er ikke den mest siterte kilden

Vi startet med å anta at Wikipedia ville komme på topp, men dataene viste noe annet.

På tvers av de fleste testede emnene var Encyclopaedia Britannica det mest siterte domenet, med totalt 1164 siteringer på tvers av alle tre modellene. Engelsk Wikipedia kom på andreplass med 433 generelle siteringer – en knapp ⅓ av Britannicas.

Den eneste kategorien der Wikipedia vant var svært spesifikke, engelskspråklige nisjeemner, der den overgikk alle andre kilder. Overalt ellers dominerte Britannica.

Graf som viser avviksrater i sitering av lokale Wikipedia-sider

Britannicas sentraliserte domenestrategi gjør jobben her. I motsetning til Wikipedia, som deler innhold på tvers av språkspesifikke underdomener (fr.wikipedia.org, es.wikipedia.org, ja.wikipedia.org), konsentrerer Britannica nesten alt innholdet sitt på britannica.com og serverer primært engelskspråklige sider. Dette ene domenet med høy autoritet akkumulerer lenkeverdi, siteringsvekt og AI-tillitssignaler om at Wikipedias distribuerte modell potensielt fragmenteres av design.

Basert på disse funnene ser det ut til at konsentrasjonen av domeneautoritet øker i AI-sitasjonskontekster på samme måte som den øker i tradisjonelle søk. Hvis innholdet ditt ligger på ett sterkt domene, er det mer sannsynlig at det dukker opp enn om det ligger på tvers av mange mindre domener.

Funn 2: En strategi kun på engelsk koster deg siteringer i utenlandske markeder

Britannicas engelskspråklige tilnærming er vellykket, men den faller kraftig på andre språk.

Da nøyaktig de samme fransk-lokaliserte emnene ble søkt etter på engelsk kontra på fransk, falt Britannicas siteringsantall med 55 %. På spansk var nedgangen 23 %. På japansk, hvor den språklige og kulturelle avstanden fra engelsk er størst, falt siteringstallet med 80 %. Så ja, strategien deres fungerer utrolig bra på engelsk, men stopper helt der.

EmnekategoriBritannica-sitater (engelske spørringer)Britannica-sitater (lokale søk)Slippe
Franske emner302135-55.30%
Spanske emner248190-23.40%
Japanske emner21642-80.60%

Britannica drar fortsatt nytte av sin enorme domeneautoritet. Selv på franske og spanske emner som ble spurt om på det lokale språket, forble det det mest siterte domenet totalt sett. Men nedgangen viser at innhold kun på engelsk står overfor et hardt ytelsestak når brukerne begynner å stille spørsmål på sitt eget språk. Den samme autoritative kilden mister mer enn halvparten av synligheten sin på fransk, og fire femtedeler av den på japansk, fordi innholdet ikke er tilgjengelig direkte.

Dette gir et krystallklart argument for hvorfor oversatt innhold ikke lenger er valgfritt i AI-søk . Engelskspråklige kilder forsvinner ikke helt fra sitater på fremmedspråk; de blir systematisk nedprioritert til fordel for lokale alternativer, og gapet er stort nok til å være en reell synlighetskostnad. Det gir mening – brukere vil mye heller lese innhold som er skreddersydd for dem (som er hele poenget med lokalisering ).

Det er også en liten knipe her på modellnivå. Britannicas styrke i fremmedspråklige søk avhenger nesten utelukkende av at GPT og Claude fortsetter å avdekke engelske kilder. Gemini unngår aktivt engelske domener i utenlandske søk, og vender seg i stedet mot lokale nettsteder som larousse.fr (32 siteringer på fransk).

Funn 3: Når AI bygger bro mellom språkhull, peker den mot engelsk Wikipedia

For delmengden av emner som bare finnes på engelsk Wikipedia, uten oversatt ekvivalent, måtte modellene ta et valg: nekte å svare, falle tilbake til sin egen kunnskap, eller henvise brukere tilbake til den engelske siden uavhengig av søkespråket (eller brobygging).

Alle tre modellene valgte å bygge bro over gapet. De siterer engelsk Wikipedia med overraskende stabile rater: GPT har et gjennomsnitt på 48,3 %, Claude 26,8 % og Gemini 19,8 %. Det som er kontraintuitivt, er at spørringer på engelsk aldri har gitt den høyeste Wikipedia-siteringsraten.

Graf som viser hvilke modeller som siterer engelsk Wikipedia mest

GPT nådde en topp på 49,3 % i spansk og japansk. Gemini oppnådde 23,3 % i fransk (mot 16 % i engelsk). Claude oppnådde 34,7 % i spansk.

Den mest plausible forklaringen er konkurransetetthet: Når du spør på engelsk om et nisjeemne på engelsk, har modellen et enormt utvalg av engelskspråklig nettinnhold å velge mellom, og sitater fordeles på tvers av mange kilder. Når du spør på et fremmedspråk om det samme nisjeemnet, har modellen ingen lokalisert autoritet å falle tilbake på, så den peker direkte til den engelske Wikipedia-siden. Jo smalere det alternative utvalget er, desto mer pålitelig blir Wikipedia som sitat.

Så dette er hva ethvert merke som opererer i fremmedspråklige markeder trenger å vite: det fremmedspråklige nettet er mindre mettet, sitasjonene er mer konsentrerte, og det å være den riktige lokaliserte kilden bærer uforholdsmessig (og fordelaktig) vekt.

Funn 4: Claude behandler engelskkunnskapelige emner annerledes

Claude viste en oppførsel som GPT og Gemini ikke gjorde. På de 75 engelskspråklige emnene som ble testet i engelske spørringer, flagget Claude 32 svar (42,7 %) som «egen kunnskap» i stedet for å sitere kilder. Da de samme engelskspråklige emnene ble søkt etter på fremmedspråk, steg andelen kraftig.

SpørrespråkEgenkunnskapsresponserProsentdel
Engelsk32 / 7542.70%
Fransk50 / 7566.60%
Spansk32 / 7542.70%
Japansk16 / 7521.30%

Vi har et par teorier: Claude kan være mer konservativ når det gjelder hallusinasjon av sitater enn sine jevnaldrende, og foretrekker å påpeke usikkerhet fremfor å finne opp kilder. Den kan ha sterkere interne sikkerhetstiltak mot å produsere resultater basert på sitater uten verifiserbar støtte. Eller den kan ha en lavere terskel for å falle tilbake til treningsdataene sine når lokaliserte kilder er sparsomme.

Uansett hva den underliggende årsaken er, viser dataene at Claude er en mindre pålitelig plattform for utgående sitater om nisjeemner kun på engelsk, spesielt når brukere søker på andre språk enn engelsk. Hvis du har satset spesifikt på Claudes synlighet, kan dette endre strategien din.

Funn 5: Når oversatte sider finnes, oppfører modeller seg svært annerledes

For emner som har oversatte Wikipedia-sider, kan modeller enten sitere den lokaliserte versjonen (es.wikipedia.org for en spansk søk) eller bruke engelsk som standard. Valget de tar varierer dramatisk fra modell til modell.

ModellGjennomsnittlig treffrate på lokal Wikipedia
GPT 5.4 Mini24.40%
Claude Haiku 4.58.40%
Gemini 3.1 Flash6.20%

GPT er, med god margin, den mest pålitelige til å gjenkjenne og sitere den lokaliserte Wikipedia-versjonen. Den gjør det omtrent en fjerdedel av tiden. Claude og Gemini siterer knapt lokale Wikipedia-sider i det hele tatt, og ligger på ensifret frekvens.

Det er imidlertid verdt å merke seg at Claude og Gemini ikke ignorerer lokalt innhold. I stedet allokerer de den siteringsandelen andre steder, til lokaliserte institusjonelle kilder. Noe som viser at lokalt alltid slår konkurrentene når det gjelder å levere informasjon.

Funn 6: AI foretrekker i stor grad lokaliserte institusjoner på fremmedspråk

Du tenker kanskje at når AI-modeller svarer på spørsmål på et morsmål, spesielt de som i stor grad er trent på engelske datasett, så oversetter de bare spørringer og returnerer de samme globale kildene. Men basert på vår forskning, endrer de i stedet siteringsatferden sin mot lokale plattformer med høy autoritet, ofte institusjonelle.

Franske spørringer

Louvre (louvre.fr) ble sitert 39 ganger. Château de Versailles fikk 29 siteringer. Larousse, det franske leksikonet, fikk 66 siteringer og ble Gemini's ledende kilde for franske emner. Histoire-France samlet 24.

Spanske spørringer

Pradomuseet (museodelprado.es) ble sitert 24 ganger. UNESCOs verdensarvportal fikk 36 siteringer. Cervantes Virtual (et digitalt bibliotek med spansk litteratur) fikk 26. Biografías y Vidas, en spanskspråklig biografidatabase, fikk 24.

Japanske søk

Det nasjonale parlamentsbiblioteket (ndl.go.jp) fikk 45 siteringer. NHK, Japans nasjonale kringkaster, ble sitert 40 ganger. Studio Ghiblis offisielle nettsted samlet 37 siteringer om relevante emner. Kotobank, en japansk referanseaggregator, fikk 22.

Engelske spørringer

Til sammenligning: Met (metmuseum.org) ble sitert 117 ganger i engelske søk. National Park Service (nps.gov) fikk 34. Pennsylvania Game Commission (pgc.pa.gov) ble sitert 34 ganger i nisjeemner kun på engelsk.

Mønsteret er konsistent. AI-modeller foretrekker kulturelt og språklig hjemmehørende institusjonelle kilder når de finnes. Museer, biblioteker, offentlige kringkastere, offentlige portaler og referanseleksikon overgår alle globale merkevarer og engelskspråklige konkurrenter i sine lokale markeder.

Finne 7: Tvillingene jakter på lokale domener hardere enn noen andre

Når man deler opp siteringer etter toppnivådomener (.fr, .es, .jp vs. globale/engelske domener), skiller én modell seg ut ved aktivt å prioritere lokale domener.

Graf som viser domenelokaliseringsklassifisering, engelske vs. japanske, franske og spanske søk

Gemini allokerer konsekvent den største andelen av sine sitater til lokale toppnivådomener på tvers av alle språk som testes. Dette stemmer også overens med Gemini sin oppførsel på Britannica: det er modellen som er mest villig til å hoppe over engelske autoritetsdomener til fordel for lokaliserte alternativer.

Dette er viktig operasjonelt for merkevarer som bygger internasjonale strategier for AI-synlighet. Hvis prioriteten din er Gemini-synlighet i utenlandske markeder, vil det å ha en lokalisert versjon av nettstedet ditt på riktig ccTLD (eller med riktige hreflang-signaler og oversatt innhold) gjøre mer arbeid enn å bli sitert av Britannica eller Wikipedia.

Hvordan dette påvirker flerspråklig AI-synlighet

Her er de viktigste konklusjonene fra studien:

Wikipedia er ikke den siteringsmonolitten folk antar (slik vi gjorde). Britannicas sentraliserte strategi overgår Wikipedias distribuerte strategi på tvers av de fleste emner, og lokaliserte institusjonelle kilder overgår begge i sine egne markeder. Hvis din AI-synlighetsstrategi er forankret rundt Wikipedia, er den sannsynligvis forankret til feil kilde.

En engelskspråklig innholdsstrategi har en målbar kostnad for synlighet av kunstig intelligens i utenlandske markeder. Britannicas nedgang på 55 % på fransk og 80 % på japansk er ikke unntak. De er en klar demonstrasjon av hva som skjer med enhver organisasjon som ikke oversetter innholdet sitt: når brukere spør på sitt eget språk, ser kunstig intelligens først etter lokale kilder, og engelske alternativer fyller bare gapet når ingenting lokalt finnes.

Lokalt innhold blir massivt belønnet. Fordi det fremmedspråklige nettet er mindre mettet, har det å være den riktige lokaliserte kilden langt mer siteringsvekt enn å være den samme kilden på engelsk. Metropolitan Museum of Arts mottar 117 siteringer innen engelske emner, mens Louvre mottar 39 på fransk. Råvolumet ser mindre ut, men andelen tilgjengelige siteringsplasser på fransk er mye høyere, og konkurransen er tynnere.

Oversettelse er nå et synlighetsspill for kunstig intelligens, ikke bare et lokaliseringsspill. KI-modeller jakter aktivt etter plattformer med høy autoritet og native oversettelser som kan tjene som primære sitatkilder i lokale markeder. Merker som oversetter innholdet sitt til språkene til målgruppene sine, posisjonerer seg for sitater som konkurrenter som bare oversetter engelsk, bokstavelig talt ikke kan oppnå. Beste praksis for flerspråklig SEO , implementering av hreflang , språkspesifikke URL-er, oversatte metadata – alt dette er sammensatt.

De fleste AI-synlighetsverktøyene der ute tar kun hensyn til engelske søk, noe som, som vi har sett, representerer en liten del av kaka. Du bør spore hvordan merkevaren din blir omtalt på forskjellige språk – og heldigvis er det mulig med Weglot Radar .

Modellatferd er ikke ensartet. GPT kobler seg mest aggressivt til engelsk Wikipedia. Claude er mest forsiktig med å dukke opp sitater i nisjeemner kun på engelsk. Gemini jakter hardest på lokale toppnivådomener. Hvis du optimaliserer for én modell, ser strategien din annerledes ut enn om du optimaliserer for en annen.

Det bredere signalet er at synligheten til AI i internasjonale markeder bygges på det samme fundamentet som alltid har støttet sterk organisk synlighet: autoritativt innhold, riktig lokalisert, servert fra et domene som brukere og robotsøkere kan stole på. Mekanismen belønner det bare skarpere nå, og straffer også fraværet av det skarpere.

Vises i flerspråklige AI-resultater før konkurrentene dine gjør det

Hele denne studien kan enkelt oppsummeres til: oversett nettstedet ditt, vis det opp der dine utenlandske målgrupper er. Selv om AI har endret søke- og forbruksvaner massivt, er det å snakke kundenes språk – og styre hvordan du snakker til dem, i stedet for å overlate det til nettleserutvidelser – en enkel, men bærekraftig måte å nå dem på.

Klar til å komme i gang? Oversett nettstedet ditt med Weglot , gratis i 14 dager .

retnings-ikon
Oppdag Weglot

Bli med over 110 000 merker som allerede oversetter nettsidene sine med Weglot

Oversett nettsiden din umiddelbart med AI, finjuster med menneskelige redigeringer, og publiser på få minutter.

I denne artikkelen tar vi en titt på:
Rakettikon

Klar til å komme i gang?

Den beste måten å forstå kraften i Weglot er å se det selv. Test det gratis og uten forpliktelser.

En demo-nettside er tilgjengelig i dashbordet ditt hvis du ikke er klar til å koble til nettstedet ditt ennå.

Les artikler du kanskje også liker

FAQ-ikon

Ofte stilte spørsmål

Ingen treff.

Blå pil

Blå pil

Blå pil