.png)
소규모 연구를 통해 구글의 AI 개요 기능이 번역 격차를 어떻게 처리할 수 있을지에 대한 초기 통찰을 제공하면서, 다국어 검색에서의 트래픽 제어에 대한 의문을 제기하고 있다.
검색이 예측 불가능하고 인공지능 중심의 영역으로 진화함에 따라, 웹사이트 운영자들은 또 다른 새로운 과제에 직면하고 있습니다: 점점 다국어화되는 디지털 환경 속에서 트래픽에 대한 통제권을 유지하는 일입니다.
우리는 구글의 AI 개요 기능이 현지 콘텐츠가 부족한 언어의 검색어를 접했을 때 어떤 일이 발생하는지 이해하고 싶었습니다. 단순히 해당 웹사이트들을 건너뛰는 것일까요? 아니면 스스로 조치를 취하는 것일까요?
결국 후자였다. 그리고 국제적 야망을 가진 기업들은 주목할 필요가 있다.
우리는 AI 검색이 다국어 콘텐츠를 어떻게 처리하는지 연구해 왔습니다. 이전 연구에서 번역되지 않은 웹사이트는 AI 검색에서 인용되지 않는다는 사실이 밝혀졌습니다. 간단한 요약이 필요하시다면 아래 영상을 참고하세요:
본 연구는 다음 논리적 단계를 다룬다: 구글이 사용자의 언어로 존재하지 않는 콘텐츠가 필요할 때 어떤 일이 발생하는가?
우리의 초기 가설에 문제가 있었습니다.
구글의 프록시 행동을 연구하기 시작했을 때, 우리는 간단한 질문에 답하고자 했습니다: 번역된 콘텐츠가 사용자의 언어로 제공되지 않을 때, 구글이 프록시 주소를 사용해 영어 원본을 직접 번역하는가?
사실, 이 이상 현상을 최초로 포착한 것은 Ahrefs 팀이었습니다. 그들은 구글이 사용자를 실제 브랜드 웹사이트로 연결하기보다 자체 프록시 도메인 아래 번역된 콘텐츠를 자주 표시한다는 사실을 발견했습니다. 이는 우리가 이전에 진행한 AI 검색 가시성 연구에 대한 영감을 주었는데, 이러한 행동이 제대로 번역된 콘텐츠의 가용성(또는 그 부족)과 관련이 있을 것이라고 의심했기 때문입니다.
그러나 우리의 연구는 중요한 복잡성을 발견했습니다: 구글 프록시의 출현은 검색어 자체와도 연관되어 있는 것으로 보입니다. 사람들이 "[제품]을 직접 구매할 수 있는 곳"과 같은 내용을 검색할 때, 구글 알고리즘은 콘텐츠가 번역되었는지 여부와 관계없이 웹사이트 링크보다 위치, 전화번호, 리뷰를 우선적으로 표시하는 경향이 있습니다.
이는 단순히 다른 언어로 검색을 실행하고 프록시 비율을 비교할 수 없음을 의미했습니다. 언어 변수와 쿼리 유형 변수를 분리하기 위해 신중하게 테스트를 설계해야 했습니다.
언어 변수를 쿼리 유형으로부터 분리하기 위해, 우리는 두 언어의 검색 결과를 비교하는 통제된 실험을 설계했습니다:
왜 폴란드어인가요? 두 가지 이유입니다: 미국에서는 널리 사용되지 않으며, AI 개요가 폴란드어로 제공되어 언어 지원 여부를 테스트하기에 이상적인 후보이기 때문입니다.
여기서 쿼리 설계가 핵심이 되었습니다. 우리는 위치 기반 트리거를 피하도록 특별히 설계된 60개의 비즈니스 중심 쿼리를 생성했습니다. 예를 들어 '구매처'나 '내 주변'과 같은 검색어는 언어와 무관하게 구글 맵스나 지역 업체 목록을 우선적으로 노출시키기 때문입니다. 대신 웹사이트 콘텐츠가 주요 답변이 될 수 있는 정보성 및 상업적 쿼리에 집중했습니다.
총 120개의 질의에 걸쳐 1,048개의 인용된 출처를 검토했습니다.
이 데이터는 흥미로운 단면을 보여준다.
폴란드어 검색 결과에서 출처의 7.9%가 구글 번역된 영어 웹사이트였습니다. 그러나 영어 검색 결과에서는 이 비율이 0%로 떨어졌습니다. 단 하나의 번역된 출처도 없었습니다.
하지만 이는 단지 표면적인 수치에 불과합니다. 구글의 AI 개요가 언어별로 어떻게 다르게 작동하는지 살펴보겠습니다.
평균적으로 AI 개요에서 인용된:
영어 검색어에 대해 58% 더 많은 출처가 제공됩니다.
이는 구글의 AI 개요 기능이 가능한 경우 쿼리 언어의 콘텐츠를 우선시함을 시사합니다. 포괄적인 답변을 제공할 만큼 충분한 폴란드어 콘텐츠를 찾을 수 없을 때, 영어 출처를 번역하여 그 공백을 메꿉니다. 그럼에도 불구하고 가능한 경우 모국어 콘텐츠를 명백히 선호합니다—이는 웹사이트를 번역해야 하는 또 다른 근거입니다(변화하는 검색 환경에 휘둘리지 않고 모든 혜택을 누리기 위해서).
데이터를 산업 분야별로 분석한 결과, 특정 분야는 다른 분야보다 구글 번역에 의해 번역될 가능성이 훨씬 더 높은 것으로 나타났습니다:
기술 콘텐츠는 전체 평균 대비 두 배 이상 높은 확률로 번역되었습니다. 그 이유는 명확합니다: 기술 관련 검색어는 매우 구체적이며 영어 중심의 용어를 자주 사용합니다. 이러한 패턴은 폴란드어 대안이 부족한 상황에서 구글이 영어 원본을 번역함으로써 콘텐츠 공백을 메우고 있을 가능성을 시사합니다.
한편 소매 콘텐츠는 현지화된 대안이 더 많은 편입니다. B2B의 경우, 폴란드어 B2B 콘텐츠가 충분히 존재해 구글이 영어 원본을 전혀 번역할 필요가 없었습니다. 따라서 특정 언어의 콘텐츠 가용성은 확실히 결정적 요인이 됩니다.
국제 비즈니스를 운영 중이라면, 이 초기 연구는 주목할 만한 세 가지 트렌드를 제시합니다:
웹사이트가 번역되지 않으면 해외 시장에서 단순히 보이지 않는 존재가 되는 것 이상입니다. 검색 결과에는 실제로 노출될 수 있지만... 원하는 방식이 아닐 수 있습니다. 저희의 제한된 샘플 조사에 따르면 구글은 귀하의 콘텐츠를 번역하여 프록시 주소 아래에 표시할 가능성이 있으며, 이는 다음과 같은 의미입니다:
검색이 점점 예측 불가능해지고 있다는 점에는 모두 동의할 수 있습니다. 인공지능 기반 검색 결과가 사람들이 콘텐츠를 발견하는 방식을 재편하고 있습니다. 이러한 환경에서 여러분이 발견되는 방식을 통제하는 것은 그 어느 때보다 중요해졌습니다.
자신의 콘텐츠를 번역할 때:
당신이 그렇게 하지 않는다면 구글이 그 공백을 메울 수 있다는 것이 우리 연구의 시사점입니다. 하지만 차라리 자신의 이야기를 직접 통제하는 편이 낫지 않을까요?
범위는 제한적이지만, 이 연구는 많은 이들이 관찰해 온 바에 대한 증거를 추가한다: 인공지능 기반 검색 도구는 사용자가 선호하는 언어로 답변을 제공하기 위해 콘텐츠를 상당히 자유롭게 변형하는 경향이 있다. 구글의 인공지능 개요는 비영어권 시장을 무시하거나 영어 결과만 고집하지 않는다. 현지 대체 콘텐츠가 부족할 경우 적극적으로 콘텐츠를 번역한다.
이 패턴이 대규모로 유지된다면, 번역 격차는 이미 메워지고 있을 수 있습니다—당신에 의해든 구글에 의해든.
본 연구는 Google AI 개요에서 SaaS, B2B, 리테일, 테크 등 4개 비즈니스 카테고리에 걸쳐 120개 쿼리(영어 60개, 폴란드어 60개)를 분석했습니다. 쿼리는 위치 기반 트리거를 피하고 정보적·상업적 의도에 집중하도록 설계되었습니다. 모든 검색은 미국에서 수행되었습니다. 총 1,048개의 출처를 번역 상태 및 원본 언어별로 분석했습니다. 쿼리는 위치 기반 트리거를 피하고 정보 및 상업적 의도에 집중하도록 설계되어 언어 가용성을 주요 변수로 분리했습니다.
Weglot 국제 트래픽을 효과적으로 관리하는 데 어떻게 Weglot 확인해 보시겠습니까? 14일 무료 체험을 시작하세요. 약정 없이 이용 가능합니다.
Weglot 힘을 이해하는 가장 좋은 방법은 직접 확인해 보는 Weglot . 무료로, 아무런 의무 없이 테스트해 보세요.
Weglot 힘을 이해하는 가장 좋은 방법은 직접 확인해 보는 Weglot . 무료로, 아무런 의무 없이 테스트해 보세요.
아직 웹사이트를 연결할 준비가 되지 않았다면 대시보드에서 데모 웹사이트를 이용할 수 있습니다.