01. 태블로 기초실습

ofohj·2023년 2월 2일
0
post-thumbnail

스터디원분(짱꼬북님)이 강의를 추천해주셔서 수강하게 된
태블로 신병훈련소 17기!! 에서 진짜 화려하고 보기 편한 시각화 툴을 알게되었다🎉

정의

태블로는 시각적 분석 도구로, 시각적 인지 과정을 분석에 접목하는 것이다. 이를 통해 데이터 파악을 쉽고 빠르게 할 수 있다.

🔻예시

✔️Today

이번 시간에는 태블로를 통해 데이터의 연결과 시각적 분석을 할 예정이다.

🗃️데이터

가구, 사무기기, 사무 용품을 판매하는 리테일 업체의 4개년도 매출 데이터

실습: 분석 및 시각화

  1. 분석 데이터 연결
  2. 어떤 제품의 실적이 안 좋은가?
  3. 수익성의 지역별 패턴을 확인할 수 있을까?
  4. 수익성 문제가 있을 시 언제부터 그랬는가? (시계열 분석)
  5. 시각화를 하나의 대시보드로 만들었을 때 새로운 인사이트 발견 여부

1. 시작

1) 타블로 설치

https://www.tableau.com/ko-kr/support/releases/desktop/2022.2.4#esdalt

2) 실행

오늘 실습은 엑셀파일로 이루어지기 때문에 노란색 밑줄 부분인 Microsoft Exel을 클릭해 파일을 연다.

🔻실행 화면

2. 데이터 불러오기

1) 새 유니온

왼쪽 하단의 새 유니온을 여기로 테이블 끌기로 끌어온다.
그러면 아래와 같은 창이 뜨는데, 자동을 선택해 실습을 진행한다.

일치 패턴을 확인한다. 왼쪽에 있는 파일명을 확인한다.
제목의 다른 부분은 *, 동일한 부분은 그대로 입력한다.
따라서, *주문데이터라고 입력하고 확인을 누른다.

🔻실행결과

2) 이름 바꾸기

유니온 클릭 - 이름 바꾸기 - '주문'으로 수정

3) 가로로 결합

관리자 데이터를 클릭한 상태로 유니온 옆으로 드래그 앤 드랍한다.

🔻실행결과

반품데이터도 마찬가지로 드래그 앤 드랍한다.

🔻실행결과

4) 추출

우측 상단의 추출을 클릭한다.

5) 시트

좌측 하단의 시트 탭을 클릭하고 저장한다.

🔻실행결과

6) 재정렬

좌측 상단의 검색에서 오른쪽으로 3칸 가면 있는 토글버튼을 눌러 폴더별 그룹화를 한다. 그렇게 하면 선을 기준으로 구분되는 것을 볼 수 있는데, 하단은 측정값의 모임이다. 하지만 여기서, 고유 id는 계산(덧셈, 평균 등)에 사용하지 않기 때문에 클릭한 상태로 위로 옮겨 드랍한다.

7) 데이터 그룹화

고객에 대한 데이터만 보기 위해 고객 세그먼트, 고객명, 고객 번호를 동시에 선택하고 토글버튼 클릭 후, 폴더 - 폴더만들기로 이동해 '고객'이라는 새로운 그룹을 만들어 준다.

3. 데이터 시각화

1) 열 생성

매출값을 상단의 열로 드래그 앤 드랍해준다.

🔻실행결과

2) 행 생성

행에 제품 대분류를 드래그 앤 드랍 한다.

🔻실행결과

3) 표현

이번엔 수익을 드래그 해 파란 막대그래프 위에 드랍한다.

🔻실행결과

그러면 위 사진과 같이 변하는 것을 확인할 수 있다.
노란 부분은 수익이 색상으로 표현되었음을 의미한다.

즉, 좌측의 마크 부분에서 선택되는 것에 따라 시각화 표현 방식이 달라진다. 위 사진은 크기로 표현한 그래프이다.

분류를 더 자세히 하고싶다면, 아래 사진과 같이 제품 중분류으로 옮기면 된다.

4) 관계

제품 중분류는 대분류에 속한다. 속하게 되면, 서로 관계를 맺을 수 있다.

(1) 제품 중분류대분류를 하나씩 바깥으로 꺼낸다. (마크 탭 아래 부분 아무데나)

(2) 제품 대분류, 중분류, 제품명을 동시에 선택 - 토글 - 계층 - 계층만들기 - '제품군'이라고 이름 입력

🔻실행 결과

(3) 제품군을 끌어 행 선반에 놓는다.

🔻실행 결과

노란 부분으로 표시된 것을 클릭하면 하위, 상위 수준으로 이동이 가능하다.

그래프의 주황 부분은 수익성 문제가 나타났음을 의미한다.
다른 부분에는 문제가 없는지 살펴보도록 하자!

5) 문제 확인 - 지역별

(1) 왼쪽의 지역을 선택해 부분의 합계 앞으로 넣는다.

(2) 표준으로 되어있던 노란 부분을 전체보기로 바꾼다.

(3) 하단의 시트 탭을 더블 클릭 하여 '제품별 매출 및 수익'으로 이름을 바꾼다.

그 옆 초록부분을 클릭하여 새로운 시트를 생성한다.

(4) 지리정보를 보기 위해 지리적 역할을 수정한다.
왼쪽의 국가 폴더 옆 Abc아이콘을 클릭한다. 지리적 역할국가/지역으로 수정한다.
시도(주/시/도)와 시군구(시군구)도 마찬가지로 수정한다.
지역만들기 원본 - 시도 로 수정한다.
국가시군구를 끌어 지역 안으로 넣어준다.
순서는 아래 사진과 같이 배치한다.

(5) 국가를 더블클릭하고 하위 폴더들을 연다

🔻실행결과

(6) 색상으로 지역별 매출을 구분하기 위해 매출 폴더를 색상으로 드래그앤드랍한다.

매출의 크기가 클수록 색상이 진해진다. 커서를 지도 위에 대면 자세한 지역 정보를 알 수 있다. 이를 통해 경기도 안양이나 울산 남구가 매출이 높음을 알 수 있다.

🔻실행결과

다른 방식으로도 표현이 가능하다. 아래는 매출 폴더를 크기로 바꾸고 색상수익 폴더를 넣은 결과이다.

색상이나 크기 탭을 눌러 설정을 다양하게 변경할 수도 있다.

(7) 4-3번의 순서에서 탁자 부분에 문제가 있는 것을 볼 수 있었다. 그래서 현재 시트를 탁자에 대한 정보로 필터링 해 보고자 한다.
이를 위해서 제품 중분류를 드래그하여 마크 위 필터 선반으로 드랍한다.
필터 팝업창이 뜨면 탁자를 선택하고 확인을 누른다.

🔻실행결과(마크의 색상에서 테마를 수정하여 직전의 결과 사진과 상이하다.)

이처럼 지역별로 시각화를 하여 어떤 지역에 문제가 가장 큰지 알 수 있다.

더 자세한 설명을 보려면 안산 지역 클릭 후 나타나는 팝업의 💡전구 탭을 선택하면 ai기반으로 설명된 데이터가 뜬다.

🔻실행결과

(8) 여기까지 확인했으면, 시트 이름을 '지역별 수익성'이라 입력하고 새 시트를 열어준다.

6) 시계열 분석

다음은 탁자 제품의 문제가 언제부터 발생했는지 확인하기 위해 시계열 분석을 하겠다. 시계열 분석을 위해서는 날짜나 시간 데이터가 포함되어야 한다.

(1) 새로 만들어진 시트에 주문일자 폴더를 더블클릭한다.
아래 사진과 같이 열 선반에 추가될 것이다. 하위 폴더를 전부 열어주고 분기, 일 데이터는 필요하지 않기 때문에 위쪽으로 드래그 앤 드랍하면 삭제된다.

(2) 년월별 매출액을 보기 위해 행 선반에 매출을 끌어온다.

🔻실행결과

(3) 수익 폴더도 마찬가지로 행으로 끌어온다. 서로 다른 마크로 구분하기 위해 수익은 영역으로 표시하였다.

(4) 수익은 연도별로 누적된 합으로 표현해 보겠다.
행 선반의 수익 부분의 토글버튼을 클릭해 퀵테이블 계산 - 누계를 선택해 준다.

📍퀵 테이블 계산: 데이터 표현에 필요한 수학적 계산식의 모음

🔻실행결과

하지만 위 표현은 원하는 방식이 아니다. 연도별로 계산을 원했지만 처음 값부터 누적되어 표현되었다.

행 선반의 수익에서 삼각형 부분을 클릭해 다음을 사용하여 계산 - 패널(옆으로)를 클릭한다. 그러면 원하는대로 표현된 것을 확인할 수 있다.

🔻실행결과

시계열 분석이 이렇게 완료되었다! 시트 이름을 시계열 분석이라고 저장한다.

7) 총정리 대시보드

(1) 대시보드 생성
지금까지 만든 데이터를 한눈에 보기 위해 대시보드를 생성하려 한다.
하단의 파일 옆 노란 표시된 부분인 새 대시보드를 클릭한다.

(2) 크기 설정
새 대시보드를 만들면 아래와 같아진다. 크기 탭에서 자동을 선택해 사이즈를 맞춰준다.

(3) 시트 놓기
왼쪽 시트 탭에 있는 시트들을 가운데 화면으로 옮겨준다. 각 시트를 놓을 위치는 사용자가 원하는대로 놓으면 된다.

🔻실행결과

(4) 탁자 문제 분석 - 제품별 매출 및 수익
이제 탁자에 어떤 문제가 있는지 자세히 살펴보겠다. 제품별 매출 수익 시트를 클릭하면 나타나는 회색 메뉴바에서 깔대기 모양(필터로 사용)을 찾아 클릭한다.

그리고 주황색 탁자 부분을 클릭하면 아래와 같이 탁자에 대한 정보만 나온다.

🔻실행결과

시계열 분석 그래프를 통해 아래와 같은 특징을 발견할 수 있었다.

📍문제는 처음부터 발생하고 있었음
📍최근들어 더 악화됨

(5) 탁자 문제 분석 - 지역별 수익성
여러 지역 중 탁자 문제가 가장 크게 나타났던 안산지역을 살펴보겠다.
마찬가지로, 지역별 수익성을 클릭하고 필터로 사용을 적용한다.

🔻실행결과

2017~2019 사이에는 문제가 발생하지 않았지만 최근 2020년도에 들어 문제가 발생했음을 알 수 있다.


이렇게 분석이 마무리 되었다! 선택을 모두 해제하고싶으면 esc키를 누르면 된다.
끝!

0개의 댓글