이 책은 빅데이터 시대, 성과를 이끌어 내는 '데이터 문해력' 책에 수록된 글을 정리한 글입니다.
데이터 문해력
💡 통계와 분석방법을 활용하기 위한 ‘사고방식’이 필요하다.
통계의 정확도를 1%라도 더 높이는 것이 아니라 실무에서 유의미한 성과를 내기 위해 필요한 일을 알아내는 것, 관계자가 정확히 이해하고 구체적인 행동이나 판단으로 옮길 수 있는 결론을 도출하는 것
내가 무엇을 알고 싶은지, 이를 알게되면 무엇을 하고 싶은지, 이를 위해서는 어떤 데이터(지표)가 필요한지 생각해보아야한다.
데이터 활용 프로세스
(겉으로 드러난 현상) → 목적과 문제를 정의 → 지표 결정 → 현재 상태 파악 → 평가 → 원인 분석 → 해결방안 모색
- ‘제조업종 관련 인재 확보가 어렵다’
- ‘제조업종 관련 채용정보를 많이 올리고 있는데 그 수요를 충족시킬 인재가 충분하지 않아서 기회손실이 막대하다’
전자는 드러나는 현상에 지나지 않다. 현상으로 어떤 점이 곤란한지, 무엇이 ‘문제’인지 명확히 하지 않는다면 상대를 이해시킬 수 없다. 두번째 경우 제조업과 자사 인재 풀 수 비교하고, 이를 다른 업종과 다시 대조해본다면 듣는 사람도 뭐가 문제인지 알 수 있다.
“효과적인”, “유연한” 방안 도출과 같은 목적은 문제에 대해 구체적인 정의를 내리기 어렵다.
결론을 도출하는 프로세스와 프레젠테이션 순서
목적과 문제를 정의 : 둘 이상의 해석이 나오지 않도록, 구체적으로 표현하고 정의하였나?
첫 번째 순서
(겉으로 드러난 현상) → 목적과 문제를 정의 → 지표 결정 → 현재 상태 파악 → 평가 → 원인 분석 → 해결방안 모색
사례를 보고 문제점을 찾아 고치자! 발생하고 있는 현상을 구체적인 ‘문제’로 설정해야 다음으로 넘어갈 수 있다. 이후 현재 직면한 문제를 어떻게 나타낼지에 대한 관점으로 지표를 고려한다.
사례 1
결론 : 고객 불편사항에 대한 개선이 이루어지고 있지 않다.
지표 : 클레임 수
→ 결론 문제 : 문제의 원인을 클레임 수에 의한 것이라 단정해서 지표 설정했을 것이다. 원인을 따져볼 땐, 클레임 수, 고객 응대 인원 등과 같이 관련된 지표를 같이 살펴보자.
→ 지표 문제 : 개선이면 클레임 수보단 클레임 수 대비 개선 수가 적절하다.
사례 2
결론 : 광고에 대한 반응이 적다
지표 : 문의 수
→ 결론 문제 : 반응을 구체적으로 정의해야한다. 어떤 반응이 없는데??
→ 지표 문제 : 문의 수는 반응의 일부이다. 광고 내용이 불명확하면 반응과 별개 문제이기에 문의 많고 적음은 지표가 될 수 없다.
사례 3
결론 : 직원 채용이 한 인재 파견 회사에만 치우쳐 있다.
지표 : ?
→ 결론 문제 : 한 회사에 치우쳐 있어서 어떤 문제가 발생했는지 명확히 정의해야한다. ex) ‘비슷한 경력의 사람만 지원’, ‘경영 상황이 지원자 수 변화에 크게 영향을 끼치고 있어서 필요할 때 인력확보가 어렵다’
사례 4
결론 : 광고 매체 선정으로 고심 중이다.
지표 : ?
→ 결론 문제 : 고심으로 어떤 문제가 발생했는데, 이에 따라 활용 지표가 달라진다. ex) ‘개인 재량으로 선택해서 광고가 재각각’, ‘선정기준이 없다’,’광고가 목표 타깃에 충분히 도달하지 못했다’
사례 5
결론 : 고객 만족도 향상
지표 : 고객 만족도 설문조사 점수
→ 결론 문제 : 만족도 향상으로 최종 무엇을 실현하나? 만족도 개선한다면 매출이나 고객 방문에 어떤 영향이 있을지 조사해서 고객 만족도 향상에 대한 목적을 명확히 해야한다.
→ 지표 문제 : 목적 명확히 하고 설문조사 항목을 정할 수 있다.
사례 6
결론 : 유급 휴가 일수 개선
지표 : 유급 휴가 신청 상황, 시간 외 근무 현황
→ 결론 문제 : 일수를 늘리는게 개선인지, 부서에 따른 휴가 일수 차이를 평준화한다는지 모름
→ 지표 문제 : 유급 휴가 신청 문제 일으킨 원인은 시간 외 근무 근무라고 원인을 단정했다.
사례 7
결론 : 담당자 의존 업무 증가
지표 : 임직원 퇴직 및 이직 데이터
→ 결론 문제 : 담당자 의존 업무란 인수인계가 어려운 업무인데 상태를 직접적으로 나타내기 어렵다. → 지표 문제 : 담당자 의존 업무의 정의가 필요하다. ‘특정 담당자 교체 없이 3년 이상 종사하고 있는 업무’라고 정의하면 이를 지표로 삼을 수 있다.
사례 8
결론 : 시간 외 근무 시간이 적절한가?
지표 : 월평균 시간 외 근무시간
→ 결론 문제 : 적절이 근무시간 외의 0인지, 근무시간 외 포함 일정 시간 이내인지 해석 여지가 많음.
→ 지표 문제 : 현황파악은 되어도 문제가 명확하지 않으니 목적에 달성하기 위해 필요한 것이 무엇인지 알 수 없다.
사례 9
결론 : 공립 유치원 대기 아동 수를 0으로 만들고자 한다.
지표 : 아동 수 추이
→ 지표 문제 : 아동 수 추이가 바뀐다고 대기 아동 수가 비례해서 변하는게 아님. 예시로 ‘지역 내 모든 시설 중, 대기 아동 수가 0인 시설 수 및 그 비율’이 적절하다.
사례 10
결론 : 00시설 평균 이용 횟수를 주 2회 이상으로 만들고자 한다.
지표 : 사용자 만족도, 기존 대비 신규 이용자 수
→ 지표 문제 : ‘만족도가 낮아서(원인) 시설 이용 빈도가 낮다’고 원인과 해결방안을 단정짓고 있다.
- 생각해야하는 순서
- 현재 상황을 어떻게 데이터로 나타낼 것인가, 어떤 지표로? : ex) 주 2회 이상 이용하는 시설이 몇 개며, 비율은?
- 문제를 세분화해서 살표볼 수 있는 지표 : ‘기존 대비 신규 이용자 수’
두 번째 순서
(겉으로 드러난 현상) → 목적과 문제를 정의 → 지표 결정 → 현재 상태 파악 → 평가 → 원인 분석 → 해결방안 모색
현황파악을 위해서는 두 가지의 차이를 인식해야한다.
사실 및 결과 표시 ≠ 평가
사실 및 결과 표시 : 데이터를 그래프나 표, 지표 등으로 표시하는 것
평가 : 구체적인 행동과 판단으로 연결하는 것
이 둘을 구분한 후, 후자에 필요한 평가를 준비하는 것이 데이터 활용의 중요한 단계이다.
평가와 우선순위 관계
평가를 하기 위해 필요한 것
데이터 평가 기준 | 대표적인 지표 |
---|---|
값의 크기 | 평균, 합계 |
추이 | 선형 그래프, 막대 그래프, 변화율 |
등락폭 | 표준편차, 도수 분포도 |
비율 | 분수, 퍼센트 |
예시) 시간 외 근무 시간을 다룬 경우
시간 평균으로 지표를 본다면, 장시간 노동으로 피해입은 사람 방치하고 다른 사람들을 매일 정시에 퇴근시키는 식으로 평균을 낮추는 극단적인 방법도 존재한다. 평균을 구하고 비교하는 시점에서 이미 ‘극단적인 상황에 부닥친 개개인에 대해 조치를 하기보다 부서 전체 평균을 낮춘다’는 전제가 성립된 것이다. 따라서 목적을 더욱 구체화한다면 적절한 접근법을 찾을 수 있다.
→ 평균은 의미없어지고 편차를 봐야하기에 편차 ‘기준’ 이 필요하다.