국제 마케팅

대규모 언어 모델(LLM)은 위키피디아를 선호할까? 이를 알아보기 위해 클로드(Claude), 제미니(Gemini), GPT의 인용 사례 6,844건을 분석했다

작성자

Rayne Aguilar

검토자

Elizabeth Pokorny

업데이트 날짜

2026년 6월 2일

이번 연구는 다국어 시장에서 AI의 행동 양상을 조사하는 저희 시리즈의 최신 연구입니다.

오랫동안, 학계 전문가들의 큰 우려에도 불구하고(아직도 머릿속 어딘가에서 “위키피디아를 사용하지 마라”는 목소리가 맴도는 분이 계신가요?), 위키피디아는 가장 기본적인 지식 출처로 여겨져 왔습니다. 위키피디아는 개방적이고 체계적이며, 무엇보다 다국어를 지원하고 끊임없이 업데이트됩니다. 이러한 점만 놓고 보면, 위키피디아는 대규모 언어 모델(LLM)에 있어 완벽한 인용 후보라고 할 수 있습니다.

그렇기 때문에 위키피디아는 레딧과 함께 대규모 언어 모델(LLM)에 있어 가장 영향력 있는 정보원 중 하나입니다. 하지만 위키피디아는 대중이 함께 만들어가는 특성상 부정적이거나 오래된 정보가 수정되어 포함될 가능성이 있으며, 이러한 정보는 AI 검색 결과에도 반영될 수 있습니다.

따라서 위키피디아가 GEO(지리정보학) 분야의 판도를 형성했다는 것이 일반적인 통념인 것은 놀라운 일이 아니다. 위키피디아가 다루는 내용을 중심으로 최적화하고, 위키피디아가 인용되는 곳에서 인용되도록 해야 한다.

하지만 우리 데이터는 다른 이야기를 보여줍니다.

웹사이트를 번역하지 않으면 존재감이 사라진다는 사실은 이미 잘 알려져 있습니다. 그렇다면 회사에 대한 위키백과 페이지가 있다면 상황이 유리해질까요?

우리는 주요 AI 모델 3종이 위키피디아를 얼마나 자주 인용하는지, 어떤 언어로 인용하는지, 그리고 대신 어떤 자료를 인용하는지 조사했습니다. 그 결과는 ‘위키피디아가 최고’라는 통념에 의문을 제기하며, 국제 시장에서 AI를 통한 브랜드 노출을 고려하는 모든 브랜드에 더 유용한 사실을 보여줍니다. 바로 대규모 언어 모델(LLM)들이 신뢰도가 높고 원어민에 의해 번역된 출처를 적극적으로 찾아 나선다는 점입니다. 이러한 자료를 발견하면 이를 인용하고, 그렇지 않을 경우 영어로 된 자료에 의존합니다.

설정

우리는 750개의 쿼리를 대상으로 Claude Haiku 4.5, Gemini 3.1 Flash, GPT 5.4 Mini가 출처를 어떻게 인용하는지 분석했습니다.

질문은 각 언어 조합(영어 전용 주제, 프랑스어-영어, 스페인어-영어, 일본어-영어)별로 위키백과 페이지 15개에서 추출하여 구성했습니다. 페이지당 5개의 쿼리가 생성되었으며, 이후 영어 전용 쿼리를 3개의 대상 언어로 번역하여 동일한 질문을 다른 언어로 물었을 때 인용 행태가 어떻게 변화하는지 테스트했습니다. 이를 통해 총 750개의 프롬프트가 생성되었으며, 각 프롬프트는 3개의 모델 모두에 입력되어 분석할 수 있는 2,250개의 개별 모델 응답을 얻었습니다.

모든 프롬프트는 모델에게 인용 출처의 URL을 명시적으로 제공하도록 요청했으며, 대신 모델의 자체 지식을 바탕으로 답변할 경우 이를 표시하도록 지시했습니다. 이후 모델의 응답을 관련 위키백과 도메인(영어 또는 대상 언어)과 대조하여, 위키백과 자체가 얼마나 자주 인용되었는지, 그리고 그 대신 어떤 도메인이 나타났는지 측정했습니다.

참고: 초기 테스트 단계에서 Claude는 출처를 명시하지 않은 채 자체 훈련 데이터에 기반한 영어 질문에 답변하고 있었습니다. 이에 따라 모든 모델에 대해 인용 출처를 명시하도록 프롬프트를 조정했습니다. 이러한 조정 이후에도 Claude는 영어 전용 주제에 대해 유난히 높은 비율로 “자체 지식” 응답을 표시하는 현상이 지속되었으며, 이에 대해서는 후술하겠습니다.

결론 1: 위키백과는 가장 많이 인용되는 출처가 아니다

우리는 위키피디아가 1위를 차지할 것이라고 예상하고 시작했지만, 데이터는 그와 정반대의 결과를 보여주었다.

조사 대상 주제 대부분에서 브리태니커 백과사전이 가장 많이 인용된 도메인으로 나타났으며, 세 모델 전체에서 총 1,164회의 인용 횟수를 기록했다. 영어 위키백과가 433회의 일반 인용 횟수로 2위를 차지했는데, 이는 브리태니커의 3분의 1 수준에 불과했다.

위키피디아가 우위를 점한 유일한 분야는 매우 전문적이고 영어로만 다루어지는 틈새 주제였으며, 이 분야에서 위키피디아는 다른 모든 정보원을 앞질렀다. 그 외의 모든 분야에서는 브리태니커가 압도적인 우위를 차지했다.

브리태니커의 중앙 집중형 도메인 전략이 여기서 효과를 발휘하고 있습니다. 언어별 서브도메인(fr.wikipedia.org, es.wikipedia.org, ja.wikipedia.org)으로 콘텐츠를 분산시키는 위키피디아와 달리, 브리태니커는 거의 모든 콘텐츠를 britannica.com에 집중시키고 주로 영어 페이지를 제공합니다. 이 단일 고권위 도메인은 링크 권한, 인용 가중치, AI 신뢰 신호를 축적하는데, 이는 위키피디아의 분산형 모델이 구조상 분산시킬 가능성이 있는 요소들입니다.

이러한 연구 결과를 바탕으로 볼 때, 도메인 권위 집중 현상은 기존 검색 환경에서와 마찬가지로 AI 인용 환경에서도 동일한 방식으로 작용하는 것으로 보입니다. 콘텐츠가 하나의 강력한 도메인에 위치해 있다면, 여러 개의 소규모 도메인에 분산되어 있는 경우보다 노출될 가능성이 더 높습니다.

결론 2: 영어 전용 전략은 해외 시장에서 인용 횟수를 감소시킨다

브리태니커 백과사전의 영어 전용 전략은 성공적이었지만, 다른 언어판에서는 성과가 크게 떨어진다.

영문과 프랑스어로 똑같은 프랑스 현지화 주제를 검색했을 때, 브리태니커의 인용 횟수는 55%나 급감했습니다. 스페인어의 경우 감소폭은 23%였습니다. 영어와 언어적·문화적 거리가 가장 먼 일본어의 경우 인용 횟수가 80%나 줄었습니다. 그렇습니다. 그들의 전략은 영어에서는 놀라울 정도로 효과적이지만, 그 이상으로는 전혀 통하지 않습니다.

주제 카테고리	브리태니커 인용 (영어 검색어)	브리태니커 인용 (지역별 검색)	내리기
프랑스 관련 주제	302	135	-55.30%
스페인어 주제	248	190	-23.40%
일본 관련 주제	216	42	-80.60%

‍

브리태니커는 여전히 막강한 도메인 권위 덕분에 우위를 점하고 있다. 현지 언어로 검색된 프랑스어 및 스페인어 주제에서도 여전히 전체적으로 가장 많이 인용된 도메인으로 꼽혔다. 하지만 이러한 하락세는 사용자가 모국어로 질문을 하기 시작하면 영어 전용 콘텐츠의 성과가 한계에 부딪힌다는 점을 보여준다. 동일한 권위 있는 출처라도 콘텐츠가 해당 언어로 제공되지 않기 때문에, 프랑스어에서는 노출도가 절반 이상, 일본어에서는 5분의 4가 감소한다.

이는 AI 검색에서 번역된 콘텐츠가 더 이상 선택 사항이 아닌 이유를 명쾌하게 설명해 줍니다. 영어 전용 출처가 외국어 검색 결과에서 완전히 사라지는 것은 아니지만, 현지화된 대안 콘텐츠에 비해 체계적으로 우선순위가 낮아지며, 그 격차는 가시성에 실질적인 손실을 초래할 만큼 큽니다. 이는 당연한 일입니다. 사용자들은 자신에게 맞춤화된 콘텐츠를 훨씬 더 선호하기 때문입니다(이것이 바로 현지화의 핵심입니다).

여기에는 모델 차원의 문제점도 있습니다. 브리태니커가 외국어 검색어에서 강점을 보이는 것은 거의 전적으로 GPT와 클로드(Claude)가 계속해서 영어 자료를 제시해 주기 때문인 것으로 보입니다. 반면 제미니(Gemini)는 외국어 검색 시 영어 도메인을 적극적으로 배제하고, 대신 larousse.fr(프랑스어 인용 32건)과 같은 현지 사이트로 전환합니다.

결론 3: AI가 언어의 장벽을 해소할 때, 영어 위키백과를 안내한다

영어 위키백과에만 존재하고 번역된 대응 항목이 없는 주제들의 경우, 모델은 세 가지 선택지 중 하나를 택해야 했습니다. 즉, 답변을 거부하거나, 자체 지식을 활용하거나, 검색 언어와 관계없이 사용자를 영어 페이지로 다시 안내하는 것이었습니다(또는 브릿징).

세 모델 모두 그 격차를 메우기로 선택했다. 이들은 놀랍도록 안정적인 비율로 영어 위키백과를 인용했는데, GPT는 평균 48.3%, Claude는 26.8%, Gemini는 19.8%를 기록했다. 직관과는 달리, 영어로 쿼리를 입력했을 때 위키백과 인용률이 가장 높게 나타난 적은 한 번도 없었다.

GPT는 스페인어와 일본어에서 49.3%로 최고치를 기록했습니다. Gemini는 프랑스어에서 23.3%를 기록했습니다(영어의 16% 대비). Claude는 스페인어에서 34.7%를 기록했습니다.

가장 타당한 설명은 ‘정보의 밀도’ 차이입니다. 영어로 된 특정 전문 주제에 대해 검색할 경우, 모델은 선택할 수 있는 방대한 양의 영어 웹 콘텐츠를 보유하고 있어 인용 출처가 여러 곳으로 분산됩니다. 반면, 같은 전문 주제에 대해 외국어로 검색할 경우 모델은 해당 언어권 내의 신뢰할 만한 출처를 찾을 수 없기 때문에, 바로 영어 위키백과 페이지를 제시하게 됩니다. 대체할 수 있는 정보의 범위가 좁아질수록, 위키백과는 인용 출처로서 더욱 신뢰할 수 있는 존재가 됩니다.

따라서 외국어 시장에서 활동하는 모든 브랜드가 알아야 할 점은 다음과 같습니다. 외국어 웹은 경쟁이 덜 치열하고, 인용이 더 집중되어 있으며, 적절한 현지화 콘텐츠를 제공하는 것이 비례하지 않을 정도로(그리고 유리한) 큰 영향력을 발휘한다는 것입니다.

결론 4: 클로드는 영어 전용 주제를 다르게 다룬다

클로드는 GPT와 제미니가 보이지 않았던 특성을 보여주었다. 영어 쿼리로 테스트한 75개의 영어 전용 주제 중, 클로드는 출처를 인용하기보다는 32개 응답(42.7%)을 “자신의 지식”으로 표시했다. 동일한 영어 전용 주제를 외국어로 쿼리했을 때, 이 비율은 급격히 상승했다.

쿼리 언어	자신만의 지식에 기반한 답변	비율
영어	32 / 75	42.70%
프랑스어	50 / 75	66.60%
스페인어	32 / 75	42.70%
일본어	16 / 75	21.30%

‍

몇 가지 가설이 있습니다. 클로드(Claude)는 다른 모델들에 비해 인용문 생성 시 더 보수적인 태도를 보일 수 있으며, 출처를 임의로 만들어내기보다는 불확실성을 지적하는 쪽을 선호할 수 있습니다. 또한 검증할 수 없는 근거를 바탕으로 인용문을 생성하는 것을 막기 위해 더 강력한 내부 안전장치를 갖추고 있을 수도 있습니다. 혹은 지역화된 출처가 부족한 경우, 훈련 데이터에 의존하는 기준이 더 낮을 수도 있습니다.

근본적인 이유가 무엇이든, 데이터에 따르면 클로드는 영어 전용 틈새 주제에 대한 외부 링크 생성 측면에서 신뢰도가 낮은 것으로 나타납니다. 특히 사용자가 영어가 아닌 다른 언어로 검색어를 입력할 때 더욱 그렇습니다. 만약 그동안 클로드의 노출 효과에만 의존해 왔다면, 이번 결과를 계기로 전략을 재검토해야 할 수도 있습니다.

결과 5: 번역된 페이지가 존재할 경우, 모델의 작동 방식이 크게 달라진다

위키백과 번역 페이지가 존재하는 주제의 경우, 모델은 현지화된 버전을 인용하거나(예: 스페인어 검색 시 es.wikipedia.org) 기본적으로 영어 버전을 사용할 수 있습니다. 모델마다 이러한 선택은 크게 다릅니다.

모델	지역 위키백과 평균 일치율
GPT 5.4 Mini	24.40%
클로드 하이쿠 4.5	8.40%
Gemini 3.1 플래시	6.20%

‍

GPT는 현지화된 위키백과 버전을 식별하고 인용하는 데 있어 압도적으로 가장 신뢰할 수 있습니다. GPT는 약 4분의 1의 확률로 이를 수행합니다. 반면 Claude와 Gemini는 현지 위키백과 페이지를 거의 인용하지 않으며, 그 비율은 한 자릿수에 불과합니다.

하지만 클로드와 제미니가 지역 콘텐츠를 외면하고 있는 것은 아니라는 점을 주목할 필요가 있습니다. 오히려 그들은 그 인용 비중을 다른 곳, 즉 현지화된 기관 출처에 할당하고 있습니다. 이는 정보 제공에 있어서는 지역 콘텐츠가 언제나 경쟁에서 우위를 점한다는 것을 보여줍니다.

연구 결과 6: AI는 외국어로 된 지역화된 기관을 훨씬 더 선호한다

AI 모델, 특히 영어 데이터셋을 주로 학습한 모델이 모국어로 질문에 답변할 때, 단순히 질문을 번역해서 동일한 글로벌 출처의 정보를 제공하는 것뿐이라고 생각할 수도 있습니다. 하지만 저희 연구에 따르면, 이러한 모델들은 오히려 인용 방식을 권위 있는 현지 플랫폼, 주로 기관 운영 플랫폼 쪽으로 전환하는 것으로 나타났습니다.

프랑스어 관련 문의

루브르 박물관(louvre.fr)은 39회 인용되었습니다. 베르사유 궁전은 29회 인용되었습니다. 프랑스 백과사전인 라루스는 66회 인용되어 제미니에서 프랑스 관련 주제의 가장 많이 인용된 출처가 되었습니다. 이스토르-프랑스는 24회 인용되었습니다.

스페인어 관련 문의

프라도 미술관(museodelprado.es)은 24회 인용되었습니다. 유네스코 세계유산 포털은 36회 인용되었습니다. 세르반테스 버추얼(스페인 문학 디지털 도서관)은 26회 인용되었습니다. 스페인어 전기 데이터베이스인 ‘Biografías y Vidas’는 24회 인용되었습니다.

일본어 검색어

국회도서관(ndl.go.jp)은 45건의 인용을 기록했습니다. 일본의 공영 방송사인 NHK는 40회 인용되었습니다. 스튜디오 지브리의 공식 사이트는 관련 주제에 대해 37건의 인용을 기록했습니다. 일본의 참고 자료 통합 사이트인 코토뱅크는 22건을 기록했습니다.

영어 질문

비교를 위해 말하자면, 메트로폴리탄 미술관(metmuseum.org)은 영어 검색어에서 117회 언급되었습니다. 국립공원관리청(nps.gov)은 34회 언급되었으며, 펜실베이니아 주 야생동물위원회(pgc.pa.gov)는 영어 전용 틈새 주제에서 34회 언급되었습니다.

이러한 경향은 일관되게 나타납니다. AI 모델은 해당 문화권 및 언어권에서 운영되는 공식 출처가 존재할 경우 이를 우선적으로 선택합니다. 박물관, 도서관, 공영 방송사, 정부 포털, 참고용 백과사전 등은 모두 자국 시장에서 글로벌 브랜드나 영어 전용 경쟁사들보다 더 우수한 성과를 보입니다.

결론 7: 제미니는 그 누구보다 적극적으로 지역 도메인을 확보하고 있다

인용 자료를 최상위 도메인(TLD)별로 분류해 보면(.fr, .es, .jp 대 글로벌/영어 도메인), 현지 도메인을 적극적으로 우선시하는 한 모델이 두드러집니다.

도메인 지역 분류 결과를 보여주는 그래프: 영어 쿼리와 일본어, 프랑스어, 스페인어 쿼리의 비교

Gemini는 테스트된 모든 언어에서 인용의 가장 큰 비중을 현지 TLD 도메인에 지속적으로 할당합니다. 이는 Britannica에서 Gemini가 보인 행동 양식과도 일치하는데, 이 모델은 영어권 권위 도메인을 건너뛰고 현지화된 대안을 선호하는 경향이 가장 뚜렷합니다.

이는 국제적인 AI 노출 전략을 수립하는 브랜드에게 운영상 중요한 의미를 갖습니다. 해외 시장에서 제미니(Gemini) 노출을 최우선 과제로 삼는다면, 해당 국가별 최상위 도메인 ( ccTLD )에 현지화된 웹사이트를 구축하거나(또는 적절한 hreflang 신호와 번역된 콘텐츠를 적용하는 것)이 브리태니커나 위키피디아에 인용되는 것보다 훨씬 더 큰 효과를 거둘 수 있습니다.

이것이 다국어 AI 가시성에 미치는 영향

이 연구에서 도출된 주요 결론은 다음과 같습니다:

위키피디아는 사람들이 (우리처럼) 생각하는 것처럼 인용의 절대적 기준이 아닙니다. 대부분의 주제에서 브리태니커의 중앙 집중식 전략이 위키피디아의 분산형 전략보다 더 우수한 성과를 내며, 현지화된 기관 출처들은 자국 시장에서 두 플랫폼 모두를 능가합니다. 만약 여러분의 AI 가시성 전략이 위키피디아에 의존하고 있다면, 아마도 잘못된 출처를 기반으로 하고 있는 것입니다.

영어 전용 콘텐츠 전략은 해외 시장에서 측정 가능한 AI 노출 손실을 초래합니다. 브리태니커의 프랑스어 콘텐츠 노출이 55%, 일본어 콘텐츠 노출이 80% 감소한 사례는 예외적인 경우가 아닙니다. 이는 콘텐츠를 번역하지 않는 모든 조직에 어떤 일이 벌어지는지를 명확히 보여주는 사례입니다. 사용자가 모국어로 검색어를 입력하면 AI는 우선 현지 언어로 된 출처를 찾으며, 현지 콘텐츠가 전혀 없을 때에만 영어로 된 대안을 찾아내어 그 공백을 메웁니다.

현지화된 콘텐츠는 훨씬 더 큰 인정을 받는다. 외국어 웹은 포화 상태가 덜하기 때문에, 적절한 현지화 자료를 제공하는 것이 영어로 된 동일한 자료를 제공하는 것보다 인용 측면에서 훨씬 더 큰 비중을 차지한다. 대영박물관(The Met)은 영어 주제에서 117건의 인용을 받는 반면, 루브르 박물관은 프랑스어 주제에서 39건을 받는다. 표면적인 인용 건수는 적어 보이지만, 프랑스어 분야에서 인용될 수 있는 자리는 훨씬 더 많으며 경쟁도 덜 치열하다.

번역은 이제 단순한 현지화 차원을 넘어 AI 가시성 확보의 핵심 요소가 되었습니다. AI 모델들은 현지 시장에서 주요 인용 출처로 활용할 수 있는, 권위 있는 원어 번역 플랫폼을 적극적으로 탐색하고 있습니다. 타겟 고객의 언어로 콘텐츠를 번역하는 브랜드들은 영어만 사용하는 경쟁사들이 도저히 얻을 수 없는 인용 기회를 선점하고 있습니다. 다국어 SEO 모범 사례, hreflang 구현, 언어별 URL, 번역된 메타데이터 등 모든 요소가 시너지를 발휘합니다.

시중의 대부분의 AI 모니터링 도구는 영어 검색어만 분석하는데, 앞서 살펴본 바와 같이 이는 전체의 극히 일부에 불과합니다. 여러분은 다양한 언어로 브랜드에 대해 어떤 이야기가 오가는지 추적하고 싶을 텐데, 다행히도 Weglot 사용하면 이것이 가능합니다.

모델별 행동 양상은 제각각입니다. GPT는 영어 위키백과로 연결하는 경향이 가장 두드러집니다. 클로드(Claude)는 영어 전용의 틈새 주제에 대한 인용 정보 노출에 가장 신중한 편입니다. 제미니(Gemini)는 현지 TLD 도메인을 가장 적극적으로 찾아냅니다. 따라서 모델에 따라 최적화 전략이 달라집니다.

더 넓은 관점에서 볼 때, 국제 시장에서 AI의 가시성은 그간 강력한 유기적 가시성을 뒷받침해 온 것과 동일한 토대, 즉 신뢰할 수 있는 도메인에서 제공되며 적절히 현지화된 권위 있는 콘텐츠를 바탕으로 구축되고 있습니다. 다만 현재는 이러한 요소가 더 큰 보상을 받는 동시에, 이를 갖추지 못했을 때 더 가혹한 불이익을 받게 되는 구조로 바뀌었을 뿐입니다.

경쟁사보다 먼저 다국어 AI 검색 결과에 노출되세요

이 연구의 핵심은 간단히 다음과 같이 요약할 수 있습니다. 웹사이트를 현지화하고, 해외 고객이 있는 곳에 적극적으로 노출하세요. AI가 검색 및 소비 습관을 크게 바꿔놓았지만, 고객의 언어로 소통하고—브라우저 확장 기능에 맡기기보다 직접 소통 방식을 주도하는 것—이야말로 고객을 효과적으로 공략할 수 있는 간단하면서도 지속 가능한 방법입니다.

시작해 보시겠습니까? Weglot으로 웹사이트를 번역해 보세요. 14일 동안 무료로 이용하실 수 있습니다.