📈

#2 UA와 GA4의 데이터를 100% 일치시킬 수 있을까?

Subtitle
두 데이터가 다르게 집계되는 이유
Tag
데이터

 데이터를 100% 일치시킬 수는 없습니다.

UA에서 GA4로 넘어오는 과정에서 마케터 분들이 가장 관심있어 하는 부분은 “UA에서 보던 데이터를 GA4에서도 그대로 보고싶다”는 것입니다. 그러나 아쉽게도 결론부터 말씀드리면 두 데이터를 100% 일치시켜서 확인하는 것은 어렵습니다. 오늘의 콘텐츠에서는 왜 두 데이터가 다르게 집계되는지, 어떤 데이터들이 어떻게 집계되는지를 설명드릴 예정입니다.

 데이터 수치가 다르게 집계되는 이유

두 플랫폼에서 데이터가 다르게 집계되는 이유는 UA와 GA4가 설계된 목적 자체가 다르기 때문입니다. UA는 이전 콘텐츠에서도 말씀드렸다시피, 2005년에 처음 등장한 웹 분석 서비스입니다. 이 당시에는 모바일이나 앱이라는 개념이 없었기 때문에 웹 로그를 분석하는데 기능의 초점이 맞춰져 있었습니다. 또한 등장한지 벌써 10년이 넘은 서비스이다보니 SPA와 같은 새로운 형태의 웹페이지에서는 잘 동작하지 않는 문제도 있습니다.
GA4는 웹 분석이라는 패러다임에서 벗어나서 웹과 앱을 통합하여 분석하는 것을 목표로 설계된 서비스입니다. 따라서 웹 분석과 앱 분석에서 동시에 활용할 수 있는 데이터 모델을 차용하는 것이 필요했습니다. 기존의 세션 기반 데이터 모델은 앱 분석에서는 활용하기 어려웠기 때문에, 웹과 앱에서 모두 사용할 수 있는 이벤트 기반의 데이터 모델로 변화하게 되었습니다. 아래에서는 변화된 데이터 모델로 인해 실질적으로 어떤 차이가 발생하는지 알아보겠습니다.

 데이터 모델의 차이 이해

UA와 GA4의 데이터 모델에 대한 이해가 선행되어야 어떤 지점에서 차이가 발생하는지를 알 수 있습니다. 아래에서는 각각 데이터 모델을 이 해하는데 중요한 핵심 키워드를 중심으로 설명드리겠습니다.

 UA 데이터 모델

전환
기존의 UA 획득 보고서에서 확인하던 전자상거래 값은 “전환”에 해당합니다. 따라서 전자상거래 값은 전환의 집계 규칙을 따릅니다.
UA에서 전환은 세션 당 한 번만 집계됩니다. 따라서 한 번의 세션 내에서 여러번 구매를 하더라도 전환은 1회로만 집계됩니다. 이 규칙은 이후 GA4와의 전환 수치를 비교하는데 있어서 중요한 기준이 됩니다.
세션
세션은 일정한 기간 내에 웹 사이트에서 발생한 사용자 상호작용의 집합을 의미합니다. 이 때 사용자의 상호작용은 페이지 조회, 이벤트, 소셜 상호작용, 전자 상거래 데이터가 해당됩니다.
UA에서 새로운 세션이 종료 또는 시작되는 조건은 아래와 같습니다.
이전 세션으로부터 30분 동안 사용자의 추가적인 활동이 없으면 세션이 종료됩니다.
새로운 캠페인이 시작되면 30분 조건과 무관하게 새로운 세션이 시작됩니다.
자정을 넘어가는 경우 세션이 종료됩니다.
캠페인
캠페인은 세션과 함께 UA에서 전환을 이해하기 위해 중요한 개념이며, 웹사이트로 유입된 트래픽을 추천한 소스의 정보를 의미합니다. 캠페인은 utm 매개변수를 통해 수집되는 source, medium, campaign, content, term 정보로 구성되어 있습니다. 일반적인 사용자들은 광고를 통해 유입된 세션에서 바로 전환을 발생시키지 않고 어느정도 탐색 기간을 가진 뒤 전환을 발생시키는 경우가 많습니다. UA에서는 이러한 광고의 잔향 효과를 고려하기 위해 캠페인 만료기간이라는 개념을 적용합니다. (캠페인 만료 기간은 설정 > 추적 정보 > 세션 설정 탭에서 확인할 수 있습니다.)
유저가 전환을 발생시킨 세션의 트래픽 소스가 직접 유입이고, 아직 캠페인 만료기간이 지나지 않았다면 가장 마지막에 상호작용이 발생했던 캠페인이 전환에 대한 기여 성과를 인정받게 됩니다. 아래는 캠페인 만료기간으로 인해, 직접 유입이 아닌 SMS가 전환 성과를 인정받는 예시입니다.

 GA4 데이터 모델

전환 GA4에서는 전환에 해당하는 이벤트가 발생할 때마다 전환으로 집계됩니다. 따라서 동일한 세션 내에서 여러번 전환을 발생시키면 모두 전환 으로 집계될 수 있습니다.
이러한 집계 규칙으로 인해 위와 같은 사용자에 대해 UA에서는 전환이 1회로 집계되고, GA4에서는 전환이 2회로 집계됩니다. 만약 GA4에서 도 UA와 동일하게 전환 수를 세션 당 한 번만 집계하고 싶다면 전환 집계 방법을 수정해야 합니다. 전환 집계 방법은 관리 > 전환 수 > 수정하려는 이벤트 우측의 ... 클릭 > 집계 방법 변경 클릭 > 우측의 사이드 메뉴에서 원하는 집계 방법을 선택하여 변경할 수 있습니다.
Data Scope
GA4에서는 데이터를 구분하는 단위를 Scope라고 부르며 크게 사용자, 세션, 이벤트로 나뉩니다. 이 데이터들은 사용자 > 세션 > 이벤트 순으로 형성되는 위계형 구조로 구성되어 있습니다.
가장 작은 단위인 이벤트부터 사용자 Scope까지, 각 Scope에 어떤 특징이 있는지 알아보겠습니다.
 Event Scope
이벤트는 GA4에서 가장 작은 데이터 수집 단위로 유저가 행하는 모든 개별적 상호작용을 의미합니다. 기여 분석 설정 탭에서 설정한 기여 모델은 Event Scope로 전환 수를 측정할 때만 적용됩니다. (기본값은 데이터 기반 모델로 설정되어 있습니다.)
GA4에서 확인할 수 있는 이벤트 유형은 아래와 같이 구분됩니다.
 Session Scope
GA4에서는 동일한 사용자가 1회 방문동안 발생시킨 이벤트 집합을 세션으로 정의하며, UA와 동일하게 30분 동안 활동이 없는 경우 세션이 종료됩니다. UA가 세션 기반의 데이터 모델이기 때문에 UA와 동일한 기준으로 성과를 집계하고 싶다면 GA4에서는 Session Scope에 해당하는 측정 기준과 항목을 사용하여 성과를 집계해야 합니다. 단, 아래와 같은 차이로 인해 기존보다 세션 수가 적게 집계될 수 있습니다.
GA4에서는 세션 또한 이벤트의 개념입니다. “session_start”라는 이벤트를 통해 새로운 세션이 시작되며, 해당 이벤트를 통해 발급되는 “session_id”라는 값을 통해 세션을 구분합니다. - 세션 수는 session_id를 기준으로 중복제거 되기 때문에 session_start 이벤트의 합과 세션 수는 일치하지 않습니다. (세션 수는 고유 session_id의 추정치로 계산됩니다.)
새로운 캠페인이 시작되더라도 기존의 세션이 종료되지 않습니다.
자정이 넘어가더라도 기존의 세션이 종료되지 않습니다.
위와 같은 집계 규칙으로 인해 세션 수의 차이 뿐 아니라 소스/매체별 전환 비중에서의 차이도 발생합니다. 예를 들어 사용자가 A 캠페인을 통해 유입된 후 30분 이내에 B 캠페인을 통해 다시 유입되더라도, A 캠페인의 세션이 종료되지 않습니다. 따라서 해당 사용자가 구매를 발생시키는 경우 UA에서는 B 캠페인의 성과로 귀속되지만 GA4에서는 A 캠페인의 성과로 귀속됩니다. (Session Scope로 성과를 측정하는 것으로 가정하였을 때)
 User Scope
GA4에서 사용자는 세션의 집합으로 익명의 사용자를 한 명으로 인식하는 단위입니다. first_visit 또는 first_open 이벤트의 발생으로 신규 사용자를 인식합니다. 단, 신규 사용자 수의 경우 고유 식별 ID를 기준으로 중복을 제거하기 때문에 firsit_visit과 first_open 이벤트 수의 합 보다는 적게 나타날 수 있습니다. 또한 사용자 인식률을 개선하기 위해 사용자 식별에 더 많은 정보를 참조하고 있기 때문에 UA 대비 사용자 수가 더 적 게 집계될 수 있습니다.
UA : 쿠키를 기준으로 사용자를 식별합니다. (쿠키가 초기화되면 다시 신규 사용자로 인식합니다.)
GA4 : 유저 ID > 구글 신호 데이터 > 쿠키 및 디바이스 ID 순서대로 매핑하여 사용자를 식별합니다.

 결론

UA와 GA4에서 데이터를 볼 때 주요 차이점과 원인을 매핑하면 아래와 같이 정리할 수 있습니다.
GA4에서는 세션 수가 더 적게 잡힐 수 있습니다. - 세션이 초기화되는 조건이 더욱 까다로워졌기 때문입니다.
GA4에서는 전환 수 (거래 수)가 더 많이 잡힐 수 있습니다. - UA에서는 세션당 한번만 전환 수가 집계되는 반면, GA4에서는 이벤트당 한번 전환 수가 집계되기 때문입니다.
GA4에서는 소스/매체별 전환 비중이 기존과 다르게 나타날 수 있습니다. - GA4에서는 새로운 캠페인이 시작되더라도, 30분 이내에 발생한 경우에는 기존의 세션을 유지하기 때문입니다.
UA와 최대한 동일한 조건으로 성과를 비교하고 싶다면 아래의 사항을 검토하여야 합니다. 그러나 GA4에서도 UA와 동일한 기준을 적용하여 성과를 집계하기 보다는 두 플랫폼의 구조적인 차이를 받아들임으로써, GA4에 적합한 방식으로 성과를 집계하시기를 권장드립니다.
측정 기준은 Session Scope를 활용해야 합니다. - 전환 집계 방법을 세션 당 한 번으로 변경하여야 합니다
UA와 GA4의 데이터 정합성을 점검하는 과정에서 차이가 너무 크게 발생하거나 자세한 원인을 점검하고 싶다면 빅쿼리를 연동하여 로그 데이터를 직접 확인하거나, 전문가와의 상담을 통한 컨설팅을 고려해보시기 바랍니다.
매드업 데이터팀은 양방향 소통을 통해 더 나은 콘텐츠를 독자분들에게 제공해드리고자 합니다. 저희가 안내 드린 주제 이외에 추가적으로 다뤄졌으면 하는 내용이 있거나, 전문 컨설팅이 필요하신 경우data_consulting_team@madup.com으로 문의 주시면 감사드리겠습니다. 더불어 매드업과 매드업 데이터팀에 대해 좀 더 궁금하시다면 아래 첨부 드리는 소개서 참고 부탁드립니다.
[MADUP] 매드업 데이터 컨설팅 2023.pdf
1811.3KB
[MADUP] 매드업 회사 소개서 2023.pdf
3108.5KB