스터디 노트🖊️_Day 44(Tableau)

정설령·2023년 5월 10일
0
post-thumbnail

✔️ Tableau 6~9

퀵 테이블 계산

1. 누계

  • 월별 매출과 누적매출 구하기

2. 차이

  • 분기별 전분기 대비 매출 차이
  • 년도별 전월 대비 매출 차이

3. 구성 비율

  • 제품 대분류별 중분류 비율

4. 순위

  • 제품 대분류 내 중분류 별 매출 3순위

5. 비율 차이

  • 전년 대비 매출 성장률과 전월 대비 매출 성장률

6. 백분위 수

  • 고객 매출별 백분위 수(상위 %)

7. 이동 평균

  • 각 5분기 매출 평균 그래프

8. YTD 총계

  • 년월 별 매출 총계

9. 통합 성장률(= 연평균 성장률)

계산된 필드

  • 계산된 필드 구성요소
    • 필드 : 데이터 원본에 존재하는 필드를 활용해 새로운 필드 생성
    • 연산자 : 함수, 필드, 매개변수 등을 연결하고 계산을 판단하는 요소
    • 매개변수 : 상수 값을 동적인 값으로 변겨해주는 변수
    • 함수 : 새로운 계산식을 적용하기 위해 기존 데이터 원본의 필드에 유형 및 역할을 결정하는데 영향을 줌

1. 연산자

  • 주문건수
  • 주문건당 단가
  • 주문건당 수량
  • 수익률
  • 년도별 현황

2. 논리함수

  • if 함수
    • 매출 2억 구분함수
    • 매출 2억 구분_TF 함수

3. 매개변수

  • 범위형 매개변수
    • 매개변수
    • 특정금액 이상 색상 구분
    • 참조선 추가
    • 최종 시트
  • 목록형 매개변수
    • 계산된 필드 만들기(원화변경)
    • 매개변수(환율)
    • 계산된 필드 만들기(KRW/USD)
    • 적용 결과
  • 날짜형 매개변수
    • 매개변수(From)
    • 매개변수(To)
    • 계산된 필드 만들기(날짜 선택)
    • 적용 결과
  • 복합 매개변수
    • 매개변수(차원 선택)
    • 매개변수(측정값 선택)
    • 계산된 필드 만들기(차원 필드 선택)
    • 계산된 필드 만들기(측정값 필드 선택)
    • 계산된 필드 만들기(단위 선택)
    • 적용 결과

내장함수

  • 태블로 내장 함수
    • 숫자 함수
    • 문자열 함수
    • 날짜 함수
    • 유형변화
    • 논리 함수
    • 집계 함수
    • 통과 함수(RAQSQL)
    • 테이블 계산 함수
    • 공간 함수
    • 예측 모델링 함수
    • 추가 함수
  • 테이블 계산 함수(PRIMARY 함수)
    • 함수 내에 다른 함수가 포함된 함수
    • RUNNING
      • RUNNING_SUM
      • RUNNING_AVG
      • RUNNING_COUNT
      • RUNNING_MAX
      • RUNNING_MIN
    • TOTAL
    • LOOKUP
    • WINDOW
      • WINDOW_SUM
      • WINDOW_AVG
      • WINDOW_COUNT
      • WINDOW_MAX
      • WINDOW_MIN

PRIMARY 함수

  • RUNNING_SUM
  • RUNNING_AVG
  • TOTAL
  • LOOKUP(vs 전년도 대비 매출액 차이 vs 퀵테이블_차이)
  • WINDOW_AVG(vs 이동평균)

문자열 함수

  • CONTAINS
    • 활용

날짜 함수

  • DATEPART
  • DATETRUNC
  • DATEDIFF
  • 날짜 함수 응용
    • MTD
    • QTD
    • YTD
    • 대시보드

LOD 표현식

  • 세부 수준식(Level of Detail)
  • 문법 : { include [차원1], [차원2] : SUM([측정값]) }
  • 종류
    • INCLUDE : 화면에 포함되지 않은 특정 차원을 포함하여 결과를 계산
    • EXCLUDE : 화면에 포함된 특정 차원을 제외하여 결과를 계산
    • FIXED : 화면에 상관없이 특정 차원을 고정하여 결과를 계산

1. INCLUDE

  • include
  • 최대 매출 고객의 하위 정보 추출
    • 최대 매출의 제품은 가구 ~2213 제품코드
  • include로 집계한 최대 가격 제품은 의자

2. EXCLUDE

  • exclude
  • 제품 중분류 전체 합계를 표현

3. FIXED

  • fixed(제품 대분류 차원 수준에서 매출의 합계를 생성)
  • fixed
  • fixed와 비교
  • 응용1
    • 첫 구매일
    • 유입 시점별 고객 매출 기여도
    • 두번째 구매일
    • 경과일
    • 첫 구매와 두번째 구매의 경과일 산출
  • 응용2 (fixed와 include 비교)
    • fixed
    • include
    • 비교
      • include를 사용한 집계값이 맞음 (fixed는 X)
      • why?
      • include는 현재 화면의 차원값을 고려하여 집계하고, fixed는 화면의 차원을 고려하지 않으므로 고유한 값이 아닐 때는 집계 값이 달라짐
      • 예) 시군구는 고유하지 않고 각 시도에 동일한 시군구가 존재
      • 그렇다면 어떻게 변경할까? → 시군구 앞에 시도 차원을 추가

태블로 작동순서

  • Order of Operations

1. 6개월 기준의 2019년도 매출 이동평균 산출

  • 위 테이블은 필터에 주문일자를 기준으로 산출한 데이터이므로 테이블 계산 순서보다 앞에 있는 필터값에 의해 2019년 1월 데이터가 제대로 적용되지 않음

  • 따라서, 다음 처럼 변경 필요

    • LAST 함수 이용해 필터기능에 0~11까지 적용한 뒤 추가

    2. 시도별 매출을 표현한 지도를 통해 제품 대분류별 수익률을 필터링하는 대시보드 만들기

  • 지도 시트

  • 차트 시트

  • 대시보드

    • 대시보드 동작 추가
    • 문제점 : 참조선이 고정되어있지 않고 계속 변경됨
    • Why?
    • 집계계산(수익률)은 차원 필터보다 후순위에 있기 때문에 차원필터가 먼저 동작하게 됨
    • 따라서, 다음처럼 변경 필요
      • 제품 대분류별 수익률 추가
      • 참조선 설정
      • 대시보드 결과

3. 매개변수를 활용하여 호남 지역의 매출 상위 10명의 고객 리스트 만들기

  • 매개변수 TOP N 추가
  • 고객명 필터
  • RANK 함수 추가
  • 지역 필터 설정
  • 결과
    • 문제점 : 10개 필터가 제대로 작동되지 않음
    • Why?
    • TOP N 매개변수가 지역 차원필터보다 우선순위가 높음
    • 따라서, context filter 추가 필요
      • 지역에 컨텍스트 추가
      • 결과

"이 글은 제로베이스 데이터 취업 스쿨의 강의 자료 일부를 발췌하여 작성되었습니다."

profile
데이터 분석가

0개의 댓글