1-1 데이터 시각화

목적 : 데이터 시각화로 통계치만으로 알 수 없는 인사이트를 도출할 수 있다. (데이터 기반의 소통)

  1. 데이터를 봐야하는 이유
  • 제품과 서비스가 실패하는 이유는 사람들의 필요를 반영하지 못해서이다.
    -> 고객의 피드백을 데이터로 분석 & 검증하고, 개선을 위한 액션 도출 (Business Analyst)
  1. 데이터 시각화의 활용
  • 가설 수립 (EDA)
  • 가설 검증 (A/B test)
  • 모니터링 (Dashboard)
  • 스토리텔링 (Presentation)
  1. 좋은 데이터 시각화를 위한 핵심 법칙
  • 시그널은 최대화, 노이즈는 최소화
    -> 정보 전달의 효율성을 고려해야한다. (개별 정보 처리량의 한계가 있기 때문)
    -> "데이터 잉크 비율을 높이자" : 중요한 부분에만 포인트를 주자
    -> 비교인식의 정확도 순서 : 위치 > 길이 > 방향 > 각도 > 면적 > 부피 > 채도

  • 데이터 시각화 체크리스트
    -> 질문에 대한 핵심 메시지가 명확한가?
    -> Action Item (행동 촉진 내용)이 있는가?
    -> 상대방과 나 사이에 공유된 컨텍스트를 고려했는가?
    -> 인사이트를 얼마나 이해하기 쉬운 형태로 전달하는가?

  • 실전 데이터 시각화 테크닉
    -> 3D 차트는 쓰지 않는다! (시각적 외곡 발생)
    -> 막대그래프의 축은 반드시 0부터 시작한다! (범주별 차이가 과도하게 강조됨)
    -> 꺾은선 그래프의 축은 잘라내도 괜찮! (트렌드를 반영하는 그래프이기 때문에)
    -> 색은 강조하고 싶은 요소에만 사용하자! (노이즈 최소화)
    -> 이중축은 혼란의 여지가 있다!
    -> 산포도는 가로축에 원인, 세로축에 결과를 표시!
    -> 사건 츅운 가로축이 기본!

  1. 데이터 스토리텔링

    단순 나열된 정보가 아니라 흐름이 있는 이야기로 만들어 뇌 활성화시키기 ( 상황 - 문제 - 해결)

  • 타겟 분석
    -> 데이터 분석은 커뮤니케이션을 목적으로 하기때문에 타겟분석이 중요함

  • 문제 찾기 (현업의 문제를 찾아가는 법)
    -> 1:1 인터뷰 등 커뮤니케이션 (신뢰와 친밀감 쌓기)

  • 의사결정자와 소통하기 ( C-level 에게 제안하기 )
    -> 결론 / 이유 & 예시 / 추천하는 액션 (핵심만 빠르게)
    -> 핵심 성과 지표 중 한 영역을 개선하도록
    -> 대면 or 서면 등 커뮤니케이션 방법에 대한 정보 필요, 제시 가능한 반론과 대처까지 준비

  • 스토리의 3단 구성
    -> 컨텍스트 설명
    -> 핵심 메시지
    -> 추천하는 액션

  • 핵심 메시지 전달하기
    -> 액션 아이템 + 득과 실 (예상)

  • 제안서의 구조
    -> 핵심 요약 메시지 - 액션아이템 - 아이템별 (무엇을 어떻게 왜)

1-2 Tableau

  1. 태블로를 쓰는 이유
  • 태블로가 생긴 이유
    1) no code
    2) Interactivity
    3) Speed
    4) Visual Technology
    5) Community
  1. 태블로 프로덕트

    태블로는 하나의 브랜드이고 그 안에 여러가지 프로덕트가 있다.

  • 데어터 전처리 -> Tableau Prep : 데이터 전처리 워크플로우 (데이터 엔지니어링 툴)
  • 데이터 시각화 -> Tableau Desktop
  • 파일 읽기 -> Tableau Reader
  • 파일 업로드 -> Tableau server, Tableau Online, Tableau Public : 데시보드 배포 및 관리(권한설정)
  1. 태블로 설치와 데이터 연결
  • 태블로 설치

    https://www.tableau.com/ko-kr/products/desktop

  • 파일 데이터 연결
    -> 데이터가 자주 업데이트 되지 않는 경우 | Ad-hoc 분석을 하는 경우

  • 서버 데이터 연결
    -> 실시간 대시보드를 만드는 경우
    -> 데이터 업데이트와 스키마 변경이 빈번할 때
    -> 보안이 중요한 데이터 (권한을 부여하는 경우)

1-3 실습

강의를 따라 첫번째 대시보드를 만들었다. 기본적인 사용법은 굉장히 쉬운것같다. 활용하기 나름이고 무엇보다 중요한 점은 로우데이터 자체를 잘 관리해야 시각화에도 도움이 될듯 하다. (그도 그럴것이 시각화는 제일 마지막 단계의 작업이기 때문에...)

1-4 태블로 핵심 3가지 개념

  1. 차원과 측정값

    차원 vs 측정값

  • 차원 : 데이터를 나눠서 볼 기준 (지역별, 년도별, 성별) -> 숫자를 자르는 기준 (범주)
  • 측정값 : 값 (매출, 수익, 배송비) -> 숫자 자체 (수치형)
  1. 연속형과 불연속형

    불연속형은 파란색(Blue pills) , 연속형은 초록색(Green pills) 으로 표시

  • 불연속형 : 개별적으로 구분되는 데이터 -> esc | desc 정렬 가능 / 머리글 있음
  • 연속형 : 연속적인 순서가 있는 데이터 -> esc | desc 정렬 불가능 / 축 있음
  1. 태블로의 집계 방식

    Row level vs Aggregate level

  • Row level : 행단위 계산 후 집계 sum( a1/b1, c2/b2 ...)
  • Aggregate level : 행 전체를 집계 후 계산 sum(a)/sum(b)
profile
T.T

0개의 댓글