원하는 정보만 쏙쏙, BigQuery로 만드는 데이터마트

안녕하세요, 인트렌치 컨설팅 정소영입니다.

현대 비즈니스 환경에서는 데이터가 단순한 기록을 넘어서 전략적 의사결정을 좌우하는 핵심 자산으로 자리잡고 있습니다.

방대한 데이터를 효과적으로 관리하고 분석해야 하는 상황 에 따라 많은 조직이 데이터 웨어하우스를 구축하고 있지만, 보다 특정 부서나 기능의 요구에 맞춘 데이터 마트 (Data Mart) 라는 개념 또한 점차 주목받고 있습니다.

데이터 마트는 마트에서 물건을 구입하듯 원하는 데이터만 쏙쏙 뽑을 수 있는 스토리지 시스템이다.

데이터마트는 데이터 웨어하우스의 하위 구성요소로, 부서별 혹은 특정 비즈니스 기능에 특화된 데이터를 정제·가공하여 빠르고 정확한 분석을 가능하게 합니다.

특히, Google Analytics (GA) 와 같은 다양한 데이터 소스와 원활하게 연계되는 Google BigQuery는 고성능 데이터 처리, 뛰어난 확장성, 비용 효율성 등 여러 면에서 최적의 플랫폼으로 주목받고 있습니다.

BigQuery가 제공하는 기능과 데이터 통합 및 관리 측면의 이점을 중심으로, 단계별 데이터 가공을 통한 데이터 마트 설계와 Looker 대시보드와의 연동을 통한 실시간 데이터 분석을 소개함으로써, 귀사의 데이터 자산 가치를 극대화할 수 있는 전략적 방향을 살펴보겠습니다.

1. 왜 BigQuery로 데이터 마트를 구축해야 하는가?

ChatGPT에게 문의한 BigQuery의 이점을 요약하자면 아래와 같습니다.

  • 확장성과 성능: 서버리스 환경과 Dremel 엔진을 통한 빠른 쿼리 실행 및 자동 확장 기능
  • 비용 효율성: 사용량 기반 과금과 Flat-rate 예약 옵션을 통한 예측 가능한 비용 관리
  • 데이터 통합 및 관리 용이성: Google Analytics, Firebase 등 다양한 데이터 소스와 원활한 연동, 그리고 ETL/ELT 자동화와 강력한 보안 기능
  • 분석 기능 및 활용성: 표준 SQL 지원, BI 도구 연계, BigQuery ML 및 실시간 스트리밍 API 제공

유지보수 편의성: 무중단 서비스, 성능 최적화 기능, Time Travel 및 체계적인 데이터 거버넌스

BigQuery의 주요 특성과 이점



이러한 BigQuery의 강점을 기반으로, 데이터 가공 단계별로 구축되는 데이터마트 설계와 Looker 대시보드를 활용한 실시간 데이터 분석 등 구체적인 적용 사례에 대해 중점적으로 다루고자 합니다.

2. 단계별 데이터 가공으로 데이터마트 설계

데이터는 수집 단계부터 최종 분석에 이르기까지 여러 가공 단계를 거치면서 활용도가 극대화됩니다.

Google Analytics(GA)뿐만 아니라 Magento, New Plantopia 등 다양한 데이터 소스를 활용할 수 있으며, 특히 L2 단계에서는 여러 매체의 데이터를 통합해 분석할 수 있습니다.

– 데이터 가공 단계별 특징과 활용 예시

1) L0: Raw 데이터

   – 데이터 소스에서 수집된 원시 데이터로, 구조화되어 있지 않아 인식하기 어렵거나 (GA의 경우) RECORD 형태와 같이 복잡한 구조의 데이터입니다.

   – GA의 경우, 이벤트 매개변수의 키와 값이 `event_params.key`, `event_params.value` 내 `int_value`, `string_value` 등 여러 컬럼으로 분산되어 적재됩니다.


— GA Raw 데이터 예시 (L0)

2) L1: 정제된 데이터 구조

   – L0 데이터를 구조화하여 필요한 데이터만 추출하고, 인식 및 분석에 용이하도록 가공합니다.

   – 주요 필드 (예. GA의 `page_location`, `ga_session_id`, `campaign`/`medium`/`source` 등) 를 개별 컬럼으로 변환하여 표준 테이블 형태로 정리합니다.


— 정제된 데이터 예시 (L1)

3) L2: 분석용 데이터마트

  • 비즈니스 요구사항에 맞춘 최종 분석용 데이터셋으로, 여러 L0/L1 테이블의 결합 데이터를 활용해 KPI 추적과 의사결정을 지원합니다.
  • 활용 예시:
    • 특정 제품군에 대한 GA, Magento 등 다양한 데이터 소스별 전환 지표 통합 분석
    • 채널별 전환율과 ROI 분석
    • 구매 전환 경로 분석

3. Looker 대시보드와 연동한 데이터 분석

데이터 분석은 단순한 수치 해석을 넘어, 정보를 직관적으로 전달하여 한눈에 인사이트를 도출하는 것이 핵심입니다.

BigQuery와 Looker의 연동을 통해, 데이터를 다양한 요구사항에 맞춰 효과적으로 시각화할 수 있습니다.

* 예를 들어, 시간대별 사용자 유입이나 지역별 전환율을 차트로 표현함으로써, 데이터 흐름과 패턴을 쉽게 파악할 수 있습니다.

맞춤형 데이터 시각화 및 분석

BigQuery 데이터 연동 시, 다양한 대시보드 요구사항에 맞춰 데이터를 가공하고 연동할 수 있습니다.

* 예를 들어, 각 부서별 다양한 니즈를 반영한 대시보드를 제작해 전사적으로 핵심 데이터를 실시간 모니터링할 수 있습니다.
BigQuery와 Looker의 결합은 기업 내 다양한 요건에 부응하는 맞춤형 대시보드 제작을 가능케 합니다.

  • 세그먼트 테이블 활용

사전에 세그먼트를 지정하여 쿼리에서 각 그룹의 데이터를 분류할 수 있습니다.

* 예를 들어, RFM 분석 기법을 활용한 고객별 타겟 관리 대시보드 제작 시:
BigQuery 에서 VIP 고객, 충성도가 높은 고객, 이탈 가능성이 높은 고객, 재구매율이 높은 고객 등의 세그먼트 테이블 생성 + RFM 분석 기법에 맞게 Score를 지정한 후, Looker Studio에서 그룹화 및 시각화

KPI 모니터링 자동화 및 손쉬운 공유
  • 자동 업데이트 및 실시간 모니터링
    캠페인 성과 대시보드를 설정하면, 매일 최신 KPI를 자동 업데이트 받아 비즈니스 성과를 지속적으로 추적할 수 있습니다.
  • 알림 및 사용자 지정 기능
    특정 KPI가 설정한 임계값을 벗어나면 자동 알림을 통해 즉각적인 대응이 가능하며, 역할 기반 접근 제어로 민감한 정보를 안전하게 공유할 수 있습니다.
  • 손쉬운 대시보드 공유
    Looker의 대시보드 공유 기능을 활용하면, 팀원 및 경영진과 중요한 데이터를 실시간으로 공유할 수 있어 협업과 의사결정 프로세스를 크게 개선할 수 있습니다.

결론

데이터마트는 단순한 데이터 저장소를 넘어, 비즈니스 인사이트 창출의 전략적 플랫폼으로 자리매김하고 있습니다.

GA 데이터와 완벽하게 연동되는 BigQuery를 활용하면, 다양한 데이터 소스를 체계적으로 정제·통합하고 Looker나 Tableau와 같은 BI 도구와 연계하여 실시간 시각화를 구현할 수 있습니다.

이처럼 BigQuery 기반 데이터마트는 데이터 활용의 폭을 한층 넓히며, 조직 전반에 걸친 데이터 중심 의사결정을 효과적으로 지원하는 핵심 엔진 역할을 합니다.

이번 포스팅에서는 데이터마트의 개념과 이를 통한 혁신적 데이터 관리 전략을 살펴보았습니다.

귀사의 데이터 자산 가치를 극대화하고, 미래 비즈니스 경쟁력을 확보하여 한 단계 더 도약하는 밑거름이 되시길 바랍니다.

Entrench Consulting
위로 스크롤