데이터 리터러시에 대하여

스파르타코딩클럽 내일배움캠프 강의 정리와 제 개인적 견해를 더해 작성하였습니다

데이터 리터러시

  • 데이터 리터러시란 Data와 literacy(문해력)의 합성어이다.
    데이터 문해력이라는 뜻이다. 단어 그대로 데이터를 이해하는 능력이라는 말이다. 즉, 데이터 리터러시가 높다는 말은 데이터를 보고 읽고 이해하며 분석능력과 분석결과를 의사소통할 수 있다는 말이다. 현대시대에 대기업부터 중견기업, 공공기관 그리고 스타트업까지도 데이터를 축적하지 않는 기업은 찾아보기가 어려워졌다. 그 말은 데이터를 기반으로한 사회가 이미 만들어졌다고 해도 과언이 아니다.

1. 데이터 리터러시를 높인다는 것은?

1) 데이터베이스가 어떻게 구성되었는지 안다.
2) 데이터를 활용하는 방법을 안다.
3) 데이터의 핵심 지표을 이해한다.
4) 데이터 분석을 통해 추구할 목표에 올바르게 접근한다.

2. 데이터 해석의 오류

1) 심슨의 역설(Simpson’s Paradox)
- 데이터 집계자료에서 전체결과에 대해 일부 범주화가 가능한 일부 데이터에서의 결과는 전체 결과를 대변하지 못할 때 부르는 말이다.
2) 시각화 자료의 왜곡
- 변수 요인에 따라 같은 대상의 결과가 시각화 자료가 달라질 수 있다.
3) 샘플링 편향
- 샘플링을 통한 분석결과가 전체모수를 제대로 대변하지 못할 때이다.

3. 상관관계 VS 인과관계

  • 상관관계
    • 두 변수가 서로 상호 의존적인지를 파악
    • 상관관계가 보통 1에서 -1까지 표시하는데 양 극단으로 가까워질수록 상관관계가 성립한다고 한다.
  • 인과관계
    • 원인과 결과라는 의미로 한 요인(원인)으로 인해 다른 요인들이 변화하는 것을 말한다.

4. 데이터 분석의 접근법

1) 문제 및 가설정의 (생각)
2) 데이터 분석 (작업)
3) 결과 해석 및 액션 도출 (생각)

-> 1, 3번의 생각하는 과정에서 데이터 리터러시가 필요하다. 데이터 분석 자체가 목적이 되지 않도록 항상 '왜?'라고 생각해야한다.

문제 정의

1. 문제 정의란

  • 데이터 분석에 있어 가장 중요한 첫 걸음이면서 시작을 위해 방향을 잡는 역할을 한다.
  • 현재 상황을 객관적으로 바라보며 구체적이고 명확한 목표 설정을 해야 한다.

< 예시 >
1. 작년 대비 금년도 판매 매출 실적을 높이기 위한 대책이 필요하다. (X)
2. 작년 하반기 수익률 20%와 금년도 상반기 수익률 15%의 차이가 났다. 금년도 상반기에는 마케팅을 실시하지 않았는데 하반기에도 마케팅없이 작년도의 수익률을 따라잡을 수 있는 변수는 무엇이 있을까?

2. 문제 정의 방법론

1) MECE (Mutually Exclusive, Collectively Exhaustive)

  • 상호 배제 및 전체 포괄을 의미하며, 논리적 사고를 위해 주로 사용되며, 빠지거나 중복된 부분없이 정리하는 것을 말함.
    < 예시 >
    - 사람 (남자, 여자, 남자어린이, 할머니) : 남자 - 남자어린이, 여자 - 할머니가 중복
    - 축구 포지션 (골키퍼, 공격수, 수비수) : 미드필더 포지션 누락
    • 휴대폰 브랜드 (삼성, 애플, 모토로라, 아이폰) : 분류 기준 중에 아이폰은 브랜드가 아님
    • 서울 지역 지역구 내에 2호선 포함 지역, 9호선 포함 지역 : 분류 기준이 불명확하고 중복, 누락이 존재

<참고 이미지>

2) 로직 트리 (Logic Tree)

  • MECE 원칙을 기반으로 하여 복잡한 문제들을 하위 문제들로 쪼개나가며 분해하여 관리가 용이하도록 함
  • 상위문제 -> 하위문제 (계층적 접근)
  • 도표 형식으로 쉽게 이해가 가능
  • 'So What, Why So?'를 통해 그래서 어떻게, 왜를 통해 논리적 사고로 구조를 만들어야 함
    <참고 이미지>

3. 문제정의 주의사항🥸

  • 결과를 공유하는 대상 정의
  • 결과로 인한 변화 생각하기
  • 경영자의 입장으로 생각하기
  • 주변 동료들과 의견 나누기
  • 스스로 고민해보기

데이터의 유형

1. 정성적 데이터 vs 정량적 데이터

1) 정성적 데이터

  • 비수치적인 정보 : 사람의 경험, 관점, 태도 등 주관적 요소
  • 주로 텍스트, 비디오, 오디오 데이터로 존재
  • 비정형, 비구조화
  • 분석에 추가적인 심화 분석을 위해 사용

2) 정량적 데이터

  • 수치로 표현되는 정보
  • 숫자 형태의 데이터
  • 개인의 해석이나 주관이 아닌 객관성 자료
  • 지표 제작 용이
  • 설문조사, 실험, 인구통계 등 활용

참고 이미지

지표 설정

1. 지표란

  • 특정 목표, 성과를 측정하는 구체적인 기준
  • 목표 달성도 평가와 전략적 의사결정에 필요한 핵심 정보 제공
  • 문제정의의 정확한 파악을 위해 필요
    -> 문제 정의를 통해 '어떤 문제를 풀고자 하는가?'를 정의 했다면, 지표는 '어떤 결과를 기대하는가?'에 대한 정량화 기준

2. 주요 지표 이해

1) Active User (활성유저)

  • 활성유저는 정의에 따라서 전략과 방향이 달라짐
  • 활성유저를 정의했다면 이탈유저가 정의됨
  • 투자를 위한 서비스 지표에 중요 역할

❗️활성유저 설정 팁

  • 서비스 내에서 어디까지 경험한 유저가 활성유저일까?
  • 일반유저와 활성유저를 나누는 기준
  • 유저는 어느 경험시점에서 효용성을 느낄까?
  • 핸들링할 수 있는 유저의 사이즈는 어느정도일까?

2) Retention Ratio (재방문율)

  • 몇 %의 유저가 서비스를 다시 사용하는지 (서비스를 이용한 유저가 다시 서비스를 이용하는 비율)
  • 리텐션이 높은 서비스는 획득비용에 투자한 비용을 빠르게 회수 가능
  • 서비스 성장에 매우 중요한 지표

2-1) Retention 측정 방법

  • N-Day
    • 서비스 사용일을 기점으로 N일 후 재방문한 Active User의 비율 (잦은 사용이 있는 서비스에 적합)
      : 예시) 카카오, 인스타그램, 게임
  • Unbounded
    • 특정 일자를 정해놓고 마지막 사용전에는 접속하지 않더라도 집계에 포함하여 Active User 집계(사용 빈도가 높지 않은 서비스에 적합)
      : 예시) 채용사이트, 쇼핑몰, 부동산 매물 서비스
  • Bracket
    • 특정 날짜 구간에 서비스를 사용한 Active User를 집계 (서비스 사용 주기가 길거나 주기적인 경우 적합)
      : 예시) 식료품 배달 서비스, 세차 서비스

3) Funnel (퍼널)

  • Funnel의 역할

    • 유저의 이탈 지점을 확인하기 위한 구조
    • 잠재고객 유입과 최종 목표 액션을 달성하는 일련의 과정
    • 모든 서비스와 비즈니스는 전환 단계 뒤로 갈수록 이용자 수가 줄어듦
    • 각 단계의 전환율을 측정 또는 첫 유입 대비 전환율 측정
      참고 이미지
  • AARRR

    • 퍼널을 활용한 프레임워크
    • 단계별 전환율을 지표화하여 서비스 보완 지점을 탐색 (단계 정의 설정 필수)
      참고 이미지

4) LTV (Life Time Value, 고객 평생 가치)

  • 한 유저 또는 모든 유저가 기업에게 평생 주는 이익은 얼마나 되는지에 대한 지표(공식을 활용)
  • 고객 생애 주기 : 유저가 서비스 사용일부터 이탈할 때까지의 기간
  • 기업의 이익을 측정하는 중요한 지표
  • LTV가 높으면 유저와 서비스의 관계가 좋고, 충성도 높은 고객이 많다는 의미

2) LTV 산출 방법

  • 이익 x Life Time x 할인율(미래 비용에 대한 현재 가치)
  • 연간 거래액 x 수익률 x 고객 지속 연수
  • 고객의 평균 구매 단가 x 평균 구매 횟수
  • (매출액 – 매출 원가) / 구매자 수
  • 평균 구매 단가 x 구매 빈도 x 구매 기간
  • (평균 구매 단가 x 구매 빈도 x 구매 기간) – (신규 획득 비용 + 고객 유지 비용)
  • 월 평균 객단가 / 월 가중 평균 잔존율

-> LTV를 산출하는 방법은 매우 여러가지이며, 서비스마다, 관점마다 다르기 때문에 다각도에서 고민하여 설정

3. 북극성 지표

1) 북극성 지표란

  • 서비스의 '성공'을 정의함
  • 서비스가 유저에게 주는 핵심가치

2) 좋은 북극성 지표 vs 안좋은 북극성 지표 (특징)

  • 좋은 북극성 지표
    • 서비스 전략의 핵심
    • 유저가 서비스에 느끼는 가치
    • 기업의 사업 목표를 나타내는 지표 중에 선행지표
  • 안좋은 북극성 지표
    • 외부요인의 영향을 많이 받는 지표
    • 유저의 여정 전반을 반영하지 못한 지표
    • 유저가 가치를 느끼지 못함
    • 측정이 안되거나, 기간 설정이 안되는 지표

3) 북극성 지표의 중요성

  • 방향성
    • 사업조직 전체가 나아가는 방향에 대한 인지가 같고, 지표를 위해 포기해도 되는 것에 대한 방향을 제시해줌
    • 사업조직의 가치창출과 진척의 체감을 조직 전체가 느낌
    • 서비스 조직이 결과에 책임을 지도록 함
  • 효율 증대
    • 전 조직은 하나의 목표에 집중
    • 조직끼리 다른 방향으로 가거나 중복된 일처리를 방지함
      참고 이미지

결론 도출

1. 결과와 결론의 차이

1) 결과

  • 데이터 처리, 분석, 모델링 이후의 구체화 데이터
  • 숫자, 통계, 그래프, 차트 등으로 나타냄

2) 결론

  • 분석 결과 데이터를 기반으로 표현한 분석 의미나 통찰
  • 데이터 기반 해석이나 추론, 권고사항을 포함함
  • 분석 목적에 대한 의미를 설명

❗️주의사항

  • 결과, 결론 도출 시에는 스토리텔링이 필요
  • 데이터를 통한 사고가 필요하고 필요 이상으로 개인의 해석을 결론에 희석 금지

2. 좋은 결론 도출 팁👍

  • 단순하고 쉽게 공유
    • 핵심 지표 위주로 공유
    • 지표 해석방법 설명
    • 지표에서 오너십 그룹이 활용할만한 포인트 제안
    • 액션 아이템을 제안 (핵심!)
  • 흥미 유발
    • 모든 내용을 담으려 하지 말고 흥미로운 파트 위주로 공유
    • 상대방이 궁금할만한 내용 고민하여 필터링
    • 디테일한 문서는 따로 공유
  • 대상자 관점의 접근
    • 공유 받는 사람의 시선에서 이해하기 쉽도록 정리
    • 지식의 저주에 빠지지 않고 논지를 뒷받침할 자료 함께 공유
    • 공유 대상자의 허들이 낮은 시각화를 활용
  • 시각화
    • 화려한 그래프 말고 공유 대상자가 직관적으로 이해할 수 있는 자료로 구성
    • 선, 막대 그래프로 거의 모든 리포팅이 가능함
    • 범례와 단위 필수 표기
  • 결론 보고서 플로우 팁
    • 전체 내용을 한 문장으로 정리요약
    • 보고서의 메인 주제 기술
    • 보고서 작성의 이유와 작성자가 원하는 변화
    • 문제 정의 단계
    • 핵심 내용 전개
    • 결론 및 액션 아이템 제안

❗️항상 가져야할 생각

  • 문제 정의와 지표 설정을 할 당시의 목적을 잊지말기
  • 결론을 공유할 대상을 명확히 하고, 어떤 변화를 가져오고 싶은지 생각하기
  • 원하는 최종 결과와 결론을 항시 논리적으로 사고하기
profile
Data analyst를 향해 도전하는 이야기

0개의 댓글