Ch3-4 Tableau for Business Analytics 01-18 (Tableau 5-9)

김민지·2023년 5월 13일
0

Part 07. Tableau

목록 보기
3/3
  1. 퀵 테이블 계산
  • 누계 : 이전까지 값들의 누적
  • 차이 : 이전 값과의 차이
  • 구성 비율 : 합해서 100%가 됨 (합 100%의 기준은 '테이블 계산 편집'에서 가능)
  • 순위 : 각각의 순위를 매김
  • 비율 차이 : 이전 값과의 퍼센트 차이 또는 성장률
  • 전년 대비 성장률 : 같은 월끼리 이전 년도와 비교(퍼센트 차이)
  • 백분위수 : 내림차순 시, 1위를 0% 기준으로 삼고, 각 항목의 순번위치를 퍼센트로 표시 (상위 or 하위 % 표시)
  • 이동 평균 : 평균을 구하는 기간이 이동함, 평균은 그 기간의 수로 나누어줌. 시험성적에 대해 평균을 구하는 것과 동일.
  • YTD(YearToDays) 총계 : 해당 년도 시작일부터 특정시점까지의 누적합계 (누계와 거의 동일)
  • 통합 성장률(연평균 성장률) : 여러 해 동안의 성장률을 평균으로 환산한 것으로, 매년의 성장률을 산술평균이 아닌 기하평균으로 환산.

  1. 계산된 필드
  • 필드 : 데이터 원본에 존재하는 필드를 활용해 새로운 필드를 만듬

  • 연산자 : 함수, 필드, 매개 변수 등을 사칙연산으로 새로운 값을 만드는 것. 데이터 원본에 있는 차원, 측정값을 사용하지 않고도 상수값을 직접 입력하여 새로운 값을 만들 수 있음.

  • 논리 함수 : 데이터 원본의 필드와 태블로 내장함수를 활용하여 데이터 형태를 바꾸거나 원하는 값을 계산하여 가지고 올 때 사용. 새로운 계산식을 적용하기 위해 기존 데이터 원본 필드에 유형 및 역할을 결정하는데 영향을 줌

  • 매개 변수 : 상수 값을 동적인 값으로 변경해주는 변수. 최근 한 달, 최근 일 년 등과 같이 필요에 따라 범위를 다르게 둬서 볼 때 사용. 매개변수는 단독으로 사용할 수 없으며, 계산식이나 참조선과 같이 사용되어야 함.
    1) 범위형 : 최솟값, 최댓값 사이 범위를 정하여 특정 간격으로 변수를 움직일 수 있음
    2) 목록형 : 목록에서 변수 선택가능
    3) 날짜형 : 날짜 선택 가능
    4) 복합 매개 변수 : 여러 매개변수 사용

  • 계산된 필드 사용 예시

-> COUNTD() : '주문건수' 등을 만드는 함수. 중복없이 count함.
-> '주문건당 수량' : 'SUM([수량])/[주문건수]'로 계산
-> IF SUM([매출]) >= 200000000 THEN '2억 이상 매출' ELSE '2억 미만 매출' END
-> IIF(SUM([매출]) >= 200000000, '2억 이상 매출', '2억 미만 매출') : 위와 같은 결과
-> 계산된 필드에 'SUM([매출]) >= 200000000'만 넣어 만들면, TF에 따라 구분해줄 수 있음.
-> 날짜형 매개변수와 '[주문 일자]>=[From] AND [주문 일자]<=[To]' 계산된 필드 사용 -> 필터에 넣기
-> 'CASE [차원 선택] WHEN 1 THEN [제품 대분류] WHEN 2 THEN [제품 중분류] END'


  1. 태블로 내장 함수
  • 실무에서 자주 쓰이는 함수 : 문자열 함수, 날짜 함수, 논리 함수, 집계 함수, 테이블 계산 함수
  • 그외 함수 : 숫자 함수, 유형 변화, 통과 함수(RAQSQL), 사용자 함수, 공간 함수, 예측 모델링 함수, 추가 함수

1) 테이블 계산 함수 (PRIMARY 함수)
: 함수 내에 다른 함수가 포함된 함수
: 괄호 안에는 무조건 함수를 이용해 집계된 값이 들어있어야 함

  • RUNNING (RUNNING_SUM, RUNNING_AVG, RUNNING_COUNT, RUNNING_MAX, RUNNING_MIN)
    -> RUNNING_SUM(=누계): 첫 번째 행에서 현재 행까지의 누적 합계를 반환
    ex) RUNNING_SUM(SUM([매출]))
    -> RUNNING_AVG(=누계평균) : 이동평균은 평균을 내는 범위가 달라지지만, 누계평균은 첫번째 값부터 현재값까지 모든값의 평균임

  • TOTAL : SUM은 해당 레벨의 차원에 맞춰 합계를 구하지만, TOTAL은 차원에 영향을 받지 않고, 모든 값의 총합을 나타냄

  • LOOKUP : 현재 행 기준으로 OFFSET만큼 떨어진 행에 대해 주어진 식의 값을 반환
  • WINDOW (WINDOW_SUM, WINDOW_AVG, WINDOW_COUNT, WINDOW_MAX, WINDOW_MIN)
    : RUNNING과 달리, 특정 범위를 지정하여 계산 가능
    -> WINDOW_AVG(=이동평균)
    ex) WINDOW_AVG(SUM([매출]), -3, 0) : 범위 시작 -3, 끝 0

2) 문자열 함수

  • CONTAINS(UPPER([제품명]), 'SMART PHONE') : 문자열에 특정 문자열이 포함되어 있는지 확인
  • SPLIT([제품명], ' ', 1) : 문자열을 특정 기준으로 분리시킨 후, 특정 순번의 것을 가져옴
  • REPLACE(UPPER([제품명]), 'SMART PHONE', 'SMARTPHONE') : 문자열 대체
  • LEFT(SPLIT([Replace], ' ', 2), 10) : 문자열의 왼쪽부터 10번째 문자까지만 출력

3) 날짜 함수

  • DATEPART('year', [주문 일자]) : 지정한 날짜의 부분을 정수로 반환
    (year, quarter-분기, month, day)
IF DATEPART('weekday', [주문 일자]) = 1 THEN 'SUN' 
ELSEIF DATEPART('weekday', [주문 일자]) = 2 THEN 'MON'
ELSEIF DATEPART('weekday', [주문 일자]) = 3 THEN 'TUE'
ELSEIF DATEPART('weekday', [주문 일자]) = 4 THEN 'WED'
ELSEIF DATEPART('weekday', [주문 일자]) = 5 THEN 'THU'
ELSEIF DATEPART('weekday', [주문 일자]) = 6 THEN 'FRI'
ELSEIF DATEPART('weekday', [주문 일자]) = 7 THEN 'SAT'
END
  • DATETRUNC : 지정한 날짜를 특정 기준으로 잘라낸 후, 새 날짜를 반환함

  • DATEPART('day', [주문 일자]) vs DATETRUNC('day', [주문 일자])
    -> DATEPART는 DAY레벨에서 주문일자를 잘라줌(연,분기,월 무시)
    -> DATETRUNC는 1월1일, 2월1일 순으로 날짜가 잘림
    -> 특정부분의 값만 반환 vs 날짜형태를 유지한채 값을 반환

  • DATEDIFF('day', [주문 일자], [배송 일자]) : 날짜 간의 차이를 반환

<월, 분기, 년 시작일로부터 특정일까지의 합계 매출 구하기>

1) MTD(MonthToDay)

DATEDIFF('month', [주문 일자], [Date]) = 0
AND
DATEDIFF('day', [주문 일자], [Date]) >= 0

-> 매개변수[Date]와 같은 달 이전 날짜까지만 보여줌

2) QTD(QuarterToDay)

DATEDIFF('quarter', [주문 일자], [Date]) = 0
AND
DATEDIFF('day', [주문 일자], [Date]) >= 0

-> 매개변수[Date]와 같은 분기 이전 날짜까지만 보여줌

3) YTD(YearToDay)

DATEDIFF('year', [주문 일자], [Date]) = 0
AND
DATEDIFF('day', [주문 일자], [Date]) >= 0

-> 매개변수[Date]와 같은 년도 이전 날짜까지만 보여줌


  1. LOD 표현식
  • 세부 수준식(Level of Detail)
    ex) {Include[차원1],[차원2] : SUM([측정값])}

  • INCLUDE : 화면에 포함되지 않은 특정 차원을 '포함'하여 결과를 계산
    { INCLUDE [제품 중분류] : SUM([매출]) }

  • EXCLUDE : 화면에 포함된 특정 차원을 '제외'하여 결과를 계산
    { EXCLUDE [제품 중분류] : SUM([매출]) }

-> INCLUDE, EXCLUDE는 FIXED로 대체 가능함

  • FIXED : 화면에 상관없이 특정 차원을 '고정'하여 결과를 계산
    { FIXED [제품 중분류] : SUM([매출]) } = { INCLUDE [제품 중분류] : SUM([매출]) }
    { FIXED [제품 대분류] : SUM([매출]) } = { EXCLUDE [제품 중분류] : SUM([매출]) }

  • { FIXED [고객명] : MIN([주문 일자]) } : 고객별 최초 주문일자 구하기


  1. 태블로 작동 순서 (Order of Operations)
    -> 계산과 필터의 작동 순서를 고려하여 만들어야 함
  1. 실무에서 태블로를 다룰 때 예상치않게 겪게 될 상황들
  • 실제로 태블로를 사용하는 경우가 많지 않음
  • 다른 툴에 비해 비용이 다소 비쌈
  • 태블로는 많은 분석 툴 중에서 데이터 시각화에 특화되었지만, 만능은 아님

<제로베이스 데이터 취업 스쿨>

0개의 댓글