개인 학습 노트

데이터 이해와 AI 기반 성과 분석(1)

seoooung 2026. 3. 30. 10:00

1-1. 데이터 마케팅의 필요성과 장점

'감'이 아닌 '데이터'로 결정하기 : 마케팅 예산을 쓰면서도 "어디에 쓴 게 진짜 효과가 있었지?"라는 고민은 모든 마케터의 공통된 숙제다. 채널별 기여도를 오직 '감'으로만 판단하거나 성과 보고 후 다음 액션이 나오지 않는다면, 그 원인은 데이터의 부재 혹은 단절에 있다.

 

1. 데이터 기반 마케팅이란?

단순히 분석 툴을 다루는 기술이 아니라 의사결정 방식의 전환을 의미한다.

• 정의 : 고객 여정에서 생성되는 데이터를 수집·해석하여 KPI를 개선하는 의사결정 프레임

• 데이터 생애 주기 : 수집(이벤트 로그 설계) → 저장(분석 툴) → 분석(퍼널/리텐션) → 실행(캠페인/AB 테스트) → 피드백(KPI 영향 평가)의 과정을 반복

 

2. 데이터로 보는 AARRR 퍼널

각 단계별 핵심 지표를 측정하고 관리하는 것이 데이터 마케팅의 시작이다.

단계 핵심 내용 측정 및 활용 예시
Acquisition(유입) 사용자를 처음 알게 되는 순간 트래픽, 클릭수, 유입 채널별 성과, CAC
Activation(활성) 사용자가 가치를 처음 체험한 시점 첫 구매, 첫 콘텐츠 소비, 활성율
Retention(유지) 사용자가 얼마나 오래 머무는가 D1/D7/D30 리텐션, MAU
Revenue(수익) 행동이 실제 수익으로 이어지는가 결제율, ARPU, LTV
Referral(추천) 사용자가 자발적으로 퍼뜨리는가 추천코드 사용, SNS 공유율, NPS

 

3. 웹(Web) vs 앱(App) 데이터 분석의 차이

웹과 앱은 단순히 디바이스의 차이가 아니라 플랫폼 생태계의 차이다.

• 웹 : 쿠키(Cookie) 기반으로 브라우저 단위로 추적. 브라우저가 바뀌거나 쿠키가 삭제되면 동일 유저 추적이 어려움

• 앱 : 광고 ID(ADID/IDFA) 기반으로 기기 단위로 추적. 스마트폰 기기당 고유한 ID가 부여되어 유니크한 식별이 가능

• 통합 분석 : 두 생태계를 연결하려면 '로그인(User ID)'이라는 공통 기준이 필수

 

4. 북극성 지표(North Star Metric)

비즈니스의 지속 성장을 가장 잘 설명하는 단일 지표를 의미한다.

• 좋은 지표의 조건 : 고객 가치와 직결되어야 하며, 매출/성장으로 연결되고 전사가 이해 가능성

• 서비스별 예시 : 이커머스의 '월간 반복 구매자 수', 구독 서비스의 '월간 구독 유지율' 등이 대표적

 

5. 마케팅 툴은 역할로 구분한다

무작정 툴을 도입하기보다 "무엇을 측정할지"부터 정의해야 한다.

• 행동 분석(Amplitude) : 어떤 행동이 전환으로 이어지는지 분석

• 웹 분석(GA4) : 어느 채널에서 유입되는지 파악

• 실행/CRM(Braze) : 특정 행동 후 자동 메시지 발송

 

1-2. 목표와 KPI 설정

1. KPI란 무엇인가

KPI(Key Performance Indicator, 핵심성과지표)는 목표 달성 여부를 판단하는 핵심 측정값이다. 좋은 KPI는 다음 3가지 조건을 갖춰야 한다.

• 측정 가능 : 숫자로 표현 가능해야 함(예 : 유입수, 가입수)

• 실행 가능 : 개선을 위한 구체적인 액션으로 연결되어야 함

• 목표 연결 : 비즈니스의 최종 목적(전환 등)과 직결되어야 함

💡 매출을 북극성 지표(NSM)로 잡지 않는 이유

매출은 결과일 뿐, 원인이 아니다. 매출에만 집착하면 일시적인 성과를 위해 사용자 경험을 훼손(예 : 과도한 광고)하게 되고, 결국 유저 이탈로 이어진다. 진정한 NSM은 '고객 가치'에 집중해야 하며, 고객이 가치를 경험하면 매출은 자연스럽게 따라온다.

 

2. 반드시 알아야 할 주요 KPI 종류

서비스의 상태를 진단하기 위해 단계별로 측정해야 하는 핵심 지표들이다.

① 유입 및 수익 KPI(성장성 판단)

CAC(고객 획득 비용) : 신규 고객 1명을 데려오는 데 드는 비용

LTV(고객 생애 가치) : 한 명의 고객이 서비스 이용 기간 동안 지불하는 총금액

                                     건강한 비즈니스 조건 : CAC < LTV (보통 1:3 이상일 때 건강하다고 판단)

• LTV(고객 생애 가치) : 한 명의 고객이 서비스 이용 기간 동안 지불하는 총 금액

• ARPU : 사용자당 평균 매출

• ARPPU : 유료 사용자당 평균 매출

② 활성 및 유지 KPI(건강도 판단)

DAU/MAU(Stickiness) : 서비스의 반복 이용 정도(Engagement)를 측정

20% 이상이면 습관화된 서비스, 10% 미만이면 개선이 시급한 상태

• 리텐션(Retention) : 특정 날짜 가입자가 일정 시간 후 다시 방문하는 비율로, 서비스의 생존을 결정하는 가장 중요한 지표다.

 

3. 실무 사례로 보는 KPI 개선 전략

이론보다 중요한 건 실제 데이터에서 '병목 구간'을 찾아내는 능력이다.

• 사례A : OTT 서비스

문제 : 무료 체험 후 60%가 이탈

- 발견 : 첫 주에 3편 이상 시청한 유저의 유료 전환율이 훨씬 높음(65%)

- 액션 : 첫 3일간 맞춤 추천 푸시를 강화하여 시청 경험을 유도

결과 : 유료 전환율 12%p 상승

• 사례 B : 패션 이커머스

문제 : 방문객은 많지만 최종 구매 전환율이 낮음

분석 : 장바구니 이탈률이 75%로 매우 높음

액션 : 리뷰 추가, 비회원 구매 옵션 도입, 무료 배송 기준 조정

결과 : 전환율 1.1%p 상승(1.8% → 2.9%)

 

⚠️ 마케터가 빠지기 쉬운 실수

① 지표의 홍수 : 너무 많은 지표(20개 이상)를 보느라 정작 중요한 것에 집중하지 못함 → 3~5개 핵심 KPI에 집중할 것

② 결과만 주시 : "매출이 떨어졌다"라는 결과만 보고 한탄함 → 선행 지표(리드 지표)를 통해 빠르게 대응할 것

➂ 목표 없는 측정 : 숫자만 쌓아두고 분석하지 않음 → 목표 대비 갭을 분석하고 액션을 도출할 것

"측정하지 않으면 개선할 수 없다."

데이터 마케팅의 본질은 툴 사용법이 아니라, 올바른 지표를 설정하고 이를 개선해 나가는 의사결정 과정에 있다.

 

1-3. 데이터 수집과 처리 과정

1. 왜 데이터를 수집해야 하는가?

데이터가 없으면 마케팅 성과를 판단할 근거가 사라진다.

사후 측정 불가 : 데이터 수집 설정을 하지 않으면 과거에 발생한 일은 알 수 없다.

• 의사결정의 기반 : "전환율이 낮다"라는 결과만 아는 것이 아니라, "어느 버튼에서 유저가 이탈했는지" 구체적인 원인을 파악하기 위해 로그가 필요하다.

 

2. 로그(Log)와 이벤트(Event) 이해하기

사용자가 서비스 내에서 행하는 모든 움직임은 '로그'라는 기록으로 남는다.

• 이벤트(Event) : 유저가 하는 구체적인 행동(예 : 버튼 클릭, 페이지 뷰, 앱 설치)

• 파라미터(Parameter) : 이벤트에 붙는 상세 정보(예 : '구매'라는 이벤트에 '상품명', '가격', '수량' 등의 정보를 추가)

💡 좋은 로그의 조건
누가, 언제, 어디서, 무엇을 했는지 명확해야 하며, 분석 목적에 맞게 이름이 일관성 있게 명명되어야 한다(Naming Convention)

 

3. 데이터가 분석되기까지의 흐름

기업의 규모에 따라 데이터 처리 방식은 달라진다.

• 스타트업(도구 활용) : GA4나 Amplitude 같은 분석 툴을 웹/앱에 바로 심어 클릭만으로 데이터를 확인한다. 관리가 쉽고 빠르지만 커스텀에 제한이 있다.

• 중견/대기업(자체 시스템) : 자체 수집 시스템을 통해 데이터를 정리한 후 빅쿼리(BigQuery) 같은 저장소에 쌓고, 루커(Looker) 같은 대시보드로 시각화한다. 원하는 대로 분석이 가능하지만 개발팀의 협업이 필수적이다.

 

⚠️ 마케터가 기억해야 할 점

데이터 수집은 개발자의 영역이 아니다. "어떤 숫자를 보고 싶은지"를 결정하는 것은 마케터의 몫이며, 이를 위해 기획 단계부터 어떤 이벤트를 심을지 개발팀과 긴밀히 소통해야 한다. 툴은 거들 뿐, 결국 질문을 던지는 것은 사람이다.

 

1-4. 데이터 분석 툴과 대시보드 이해

1. 분석 툴이 왜 필요한가?

수많은 로그 데이터를 사람이 직접 계산하는 것은 불가능에 가깝다. 분석 툴은 데이터를 시각화하여 '어디서 유입되었는지'와 '어떤 행동을 하는지'를 실시간으로 파악하게 해준다.

 

2. 주요 분석 툴 비교(GA4 vs Amplitude)

실무에서 가장 많이 쓰이는 두 툴은 목적부터 확연히 다르다.

구분 Google Analytics 4 (GA4) Amplitude
주요 목적 유입 분석 (Acquisition) 행동 분석 (Product Analytics)
핵심 질문 "어디서 우리 서비스를 알고 왔는가?" "유저가 서비스 안에서 무엇을 하는가?"
강점 광고 성과 측정, UTM 추적 최적화 퍼널 이탈 분석, 리텐션, 유저 세그먼트
데이터 단위 세션 및 이벤트 중심 유저 및 이벤트 중심
 

3. GA4의 핵심 : 유입 경로 파악(UTM)

GA4를 제대로 쓰기 위해서는 UTM(Urchin Tracking Module) 파라미터를 이해해야 한다. 광고 소재별로 고유한 값을 붙여, 어떤 광고가 실제 결제로 이어졌는지 추적하는 방식이다.

• utm_source : 어디서 왔는가(예 : facebook, google)

• utm_medium : 어떤 유형인가(예 : cpc, display, email)

• utm_campaign : 어떤 캠페인인가(예 : summer_sale)

 

4. Amplitude의 핵심 : 유저 행동 깊게 보기

앰플리튜드는 유저의 '행동'을 쪼개서 보는 데 특화되어 있다.

• 코호트(Cohort) 분석 : 공통된 특성을 가진 유저 그룹을 묶어 분석(예 : '지난주 가입자 중 3번 이상 방문한 유저')

• 퍼널 분석 : 가입부터 결제까지 각 단계에서 유저가 얼마나 이탈하는지 정밀하게 측정

• 리텐션 분석 : 특정 행동을 한 유저가 시간이 지나도 계속 남는지 확인

 

5. 데이터 시각화와 대시보드

좋은 대시보드는 예쁜 그래프가 아니라 '의사결정에 필요한 지표'가 한눈에 들어오는 대시보드다.

루커 스튜디오(Looker Studio) 등을 활용해 다음과 같은 구성이 권장된다.

오늘의 핵심 지표 : DAU, 신규 가입자, 전환 건수

주간 추이 : 일별 방문자 및 전환율 그래프

➂ 채널별 성과 : 채널별 유입 수 및 CAC(고객 획득 비용

 

1-5. 미디어 믹스와 데이터 마케팅 전략

한정된 예산으로 최대 효율 뽑아내기 : "광고 예산 5,000만 원을 어디에 써야 할까?"라는 질문에 명확히 답할 수 있는 마케터는 많지 않다. 단순히 채널을 늘리는 것이 아니라, 데이터를 기반으로 채널별 성과를 비교하고 예산을 재배분하는 미디어 믹스(Media Mix) 전략이 필요한 이유다.

 

1. 미디어 믹스란 무엇인가?

• 정의 : 목표 달성을 위해 여러 광고 채널(네이버, 인스타그램, 유튜브 등)을 최적의 비율로 조합하는 전략

핵심 질문 : 어느 채널이 가장 효과적인가? 예산을 어떻게 나눌 것인가? 어떻게 집행할 것인가?

 

2. 성과 측정의 핵심 지표 : ROI vs ROAS

데이터 마케팅 성과를 판단할 때 반드시 구분해서 사용해야 하는 지표다.

• ROAS(광고비 대비 매출액) : 매출액 ÷ 광고비 × 100

- 예 : 100만 원 써서 500만 원 벌었으면 ROAS는 500%다. 광고 자체의 직접적인 효율을 볼 때 사용한다.

• ROI(투자 대비 수익률) : (매출 - 원가 - 광고비) ÷ 광고비 × 100

- 예 : 실제 순이익이 얼마나 남았는지 '비즈니스의 건전성'을 판단할 때 사용한다.

 

3. 채널별 성과 비교와 인사이트

단순히 유입이 많다고 좋은 채널은 아니다. 각 채널의 역할을 데이터로 확인해야 한다.

• 네이버 검색 : 구매 의사가 있는 유저가 유입되므로 ROAS가 높지만 확장성에 한계가 있다.

• 인스타그램 : 신규 유저 발견에 유리하지만 이탈률이 높을 수 있다.

• 유튜브 : 브랜드 인지도 확산에는 좋으나 직접적인 전환율은 낮을 수 있다.

 

4. 예산 최적화 3단계(Optimization)

현황 파악 : 각 채널의 ROAS를 비교하고, 효율이 낮은 '돈 낭비' 채널을 찾아낸다.

예산 재배분 : 효율이 높은 채널(예 : 검색광고) 비중을 높이고, 낮은 채널(예 : 배너광고) 비중을 줄인다.

➂ 테스트 및 측정 : 약 2주간 실험 후 성과가 좋아지면 유지하고, 나빠지면 다시 원복한다.

 

⚠️ 마케터가 하지 말아야 할 것

모든 채널에 균등 배분 : "골고루 하면 좋겠지"라는 생각은 효율을 갉아먹는다.

한 번 정하고 방치 : 시장 상황은 매일 변한다. 최소 주 1회는 성과를 확인해야 한다.

➂ 감으로만 판단 : "유튜브가 대세니까"라는 유행보다 내 서비스의 데이터를 믿어야 한다.

 

2-1. 고객 세그먼트 분석 기초

누구에게 무엇을 제안할 것인가? : 마케팅 예산을 들여 1만 명에게 똑같은 할인 쿠폰을 뿌렸는데 전환율이 1%라면 무엇이 문제일까? 20대 대학생은 관심이 없고, VIP 고객은 일반 고객 취급에 실망하며, 이탈 위험 고객만 겨우 반응했기 때문이다. 데이터 마케팅의 핵심은 고객을 세그먼트(Segment)로 나누어 맞춤형 전략을 실행하는 데 있다.

 

1. 세그먼트(Segment)란?

비슷한 특징이나 행동 패턴을 가진 고객 그룹을 의미한다. 고객을 나누는 이유는 한정된 자원으로 마케팅 효율을 극대화하기 위해서다.

2. 세그먼트 분류의 3가지 기준

고객을 나누는 기준은 크게 세 가지로 구분할 수 있다.

• 인구통계 기반(Demographic) : 성별, 연령, 거주 지역 등(예 : 20대 서울 거주 여성)

• 행동 기반(Behavioral) : 서비스 내 활동 내역(예 : 최근 30일간 구매 3회 이상, 장바구니 담기 후 이탈)

• 가치 기반(Value) : 비즈니스에 기여하는 정도(예 : 누적 결제 금액 상위 10% VIP)

 

3. 세그먼트 분석 시 주의할 점

• 너무 잘게 나누지 마라 : 세그먼트가 너무 많아지면 관리 비용이 더 커진다. 유의미한 모수(인원수)가 확보되는 수준에서 나눠야 한다.

• 지속적인 업데이트 : 고객의 상태는 변한다. 어제의 '신규 유저'가 오늘의 '이탈 유저'가 될 수 있으므로 주기적으로 데이터를 갱신해야 한다.

 

2-2. 개인화 마케팅 전략

스팸이 아닌 '선물'이 되는 메시지 전략 : 모든 고객에게 똑같은 "신상품 20% 할인" 문자를 보내는 시대는 지났다. 관심 없는 고객에게는 스팸이고, 이미 구매한 고객에게는 짜증을 유발하기 때문이다. 데이터 마케팅의 정점은 고객의 여정을 따라 딱 필요한 시점에 최적의 제안을 하는 '개인화 마케팅'에 있다.

 

1. 개인화 마케팅이란?

정의 : 유저의 행동 데이터와 취향을 바탕으로 개개인에게 맞춤화된 메시지를 전달하는 전략

 차이점 : 일반 마케팅이 '상품' 중심이라면, 개인화 마케팅은 '유저' 중심

 결과 : 평균 전환율 0.5%에서 개인화 적용 시 5% 이상으로 약 10배 가까운 성과 차이를 만들 수 있다.

 

2. 고객 여정(User Journey)과 개인화

고객이 서비스를 인지하고 충성 고객이 되기까지의 각 단계마다 마케팅의 목표와 메시지는 달라져야 한다.

➀ 인지 단계 : 앱 설치 직후 가입을 망설이는 단계

➁ 관심/고려 단계 : 상품을 찜하거나 장바구니에 담는 단계

➂ 구매 단계 : 첫 결제가 일어나는 결정적 단계

➃ 충성 단계 : 반복 구매를 통해 팬이 되는 단계

 

3. 개인화 메시징의 3요소

 Target(누구에게) : 세그먼트 분석을 통해 정의된 특정 유저 그룹

 Message(무엇을) : 유저의 결핍을 해결하거나 흥미를 끌 수 있는 맞춤 내용

 Timing(언제) : 유저가 가장 반응하기 좋은 순간(예 : 장바구니 담기 1시간 후)

 

2-3. 고객 유지 지표 이해

리텐션과 LTV : 지속 가능한 성장의 열쇠

신규 고객을 데려오는 비용(CAC)은 계속 비싸지고 있다. 이제는 데려온 고객이 얼마나 오래 머물고(Retention), 우리 서비스에 얼마를 지출하는지(LTV)가 비즈니스의 생존을 결정한다.

 

1. 리텐션(Retention)이란?

일정 기간이 지난 후에도 서비스를 계속 사용하는 고객의 비율을 말한다.

중요성 : 리텐션이 낮으면 아무리 광고비를 써도 유저는 계속 빠져나간다.(밑 빠진 독에 물 붓기)

 주요 지표 : 가입 다음 날(D1), 7일 후(D7), 30일 후(D30)의 잔존율을 확인한다.

 

2. 코호트 분석(Cohort Analysis)

특정 기간에 가입한 유저들을 그룹(코호트)으로 묶어 시간 흐름에 따른 행동 변화를 분석하는 방법이다.

 목적 : "10월 가입자보다 12월 가입자의 리텐션이 높은가?"를 비교하여 온보딩이나 서비스 개선의 효과를 증명할 수 있다.

 

3. LTV(고객 생애 가치)

한 명의 고객이 서비스를 이용하는 전체 기간 동안 가져다주는 총이익의 합계다.

 계산 공식 : 

 비즈니스 판단 기준 : LTV가 CAC(고객 획득 비용)보다 최소 3배 이상이어야 건강한 구조로 본다.

 

2-5. 케이스 스터디(GA4)

데이터를 보는 목적은 단순히 숫자를 확인하는 것이 아니라, 그 안에서 '의미 있는 인사이트'를 발견하여 다음 액션을 결정하는 데 있다. 구글의 실제 샘플 데이터를 활용해 분석 리포트를 작성하는 과정을 정리한다.

 

1. 데이터 분석의 대상 : Google Merchandise Store

분석 툴 : GA4(Google Analytics 4)

 분석 데이터 : 구글 브랜드 굿즈를 판매하는 실제 커머스 사이트의 로그 데이터

 핵심 지표 : 매출, 전환율, 세션(방문), 채널별 성과 등

 

2. [실습] 1페이지 분석 리포트 작성

강의 자료의 예시 답안을 바탕으로 정리한 28일간의 비즈니스 현황 리포트다.

① 요약(Summary)

 분석 기간 : 2025년 9월 25일 ~ 10월 22일(총 28일)

 주요 성과 : 매출액 $336,606, 전체 전환율 1.93%

 활동 데이터 : 총 세션(방문) 91,672건, 총 구매 1,754건

 

② 채널별 성과 분석(주요 데이터)

어떤 경로로 들어온 유저가 가장 결제를 많이 했는지 분석한 결과다.

유입 채널 전환율 (CVR) 특이사항
Email 4.87% 전체 1위. 가장 효율이 좋은 채널
Referral 2.98% 타 사이트 링크를 통한 유입 성과 양호
Direct 2.77% 직접 주소를 치고 들어오는 충성 고객층 존재
Paid Search 1.55% 유료 검색 광고 효율은 평균 이하
Organic Search 1.30% 최저 수치. 검색 엔진 최적화(SEO) 개선 필요
 

③ 핵심 인사이트(Insights)

이메일 마케팅의 고효율 : 이메일 유입 유저의 전환율이 4.87%로 압도적이다. 현재보다 세션(유입량)을 더 늘릴 수 있는 캠페인을 확장해야 한다.

다이렉트 유입 의존도 : 직접 유입 비중이 높다는 것은 브랜드 인지도는 좋으나, 반대로 신규 유저를 데려오는 외부 채널의 힘이 약하다는 뜻일 수 있다.

오가닉 서치 개선 시급 : 자연 검색을 통한 유입과 전환율이 가장 낮다. 검색 결과 상단 노출을 위한 콘텐츠 보강이 필요하다.

 

④ 다음 액션(Next Action)

[즉시] : 전환율이 가장 높은 이메일 구독자 대상 특별 프로모션 발송 및 모수 확대

 [단기] : 유료 광고(Paid Search)의 키워드 효율을 재검토하여 비효율 키워드 정리

 [중기] : 주요 상품 페이지의 SEO(검색 엔진 최적화) 작업을 통한 오가닉 유입 질 개선