해당 글은 제로베이스데이터스쿨 학습자료를 참고하여 작성되었습니다
매순간 수많은 데이터가 쏟아지고 있는 상황에서 데이터에 담겨있는 의미를 빨리 파악하고 목적에 맞게 활용하는 능력은 빅데이터 시대의 필수 생존요건으로 간주된다.
출처 : [네이버 지식백과] 데이터 리터러시 [data literacy] (한경 경제용어사전)
"모든 사람들이 데이터를 보고 쉽게 바르게 이해할 수 있도록 돕는다"는 목적으로 개발됨
유연한 데이터연결
직관적인 Drag & Drop 인터페이스
다양한 형태의 시각화
컴퓨터, 태블릿, 스마트폰 등의 여러기기에서 사용가능(*디지털 노마드 최적화)
*디지털 노마드 : 시공간에 제약없이 일하는 사람
태블로는 아래의 데이터들을 연결할 수 있다.
연습용으로 로컬내의 엑셀을 연결해보자
첫 테이블을 등록하고 논리적 테이블 상태(기본상태)에서 더블클릭하면 물리적 테이블 세팅이 열리게 된다.
해당 상태에서 다른 테이블을 드래그해서 옆으로 가져오면 Join이 되는데 이 때 테이블은 물리적으로 결합된다.
논리적 테이블에서 드래그해서 가져오면 논리적으로 연결된다.
이 때 각 테이블은 결합되어 있지 않다. 각자의 테이블에 데이터를 가지고 있을 뿐이다.
Orders 테이블
Returns 테이블
출처 : Tableau 공식 사이트
1) 우측 상단의 필터에서 "추가" 선택
2) 한번더 "추가..." 선택
3) 필드를 선택 후 확인
4) 원하는 값을 선택하고 확인
5) 필터링 확인
필터링 적용 전 : 8001개 행
필터링 적용 후 : 1700개 행
6) step4에서 "제외" 클릭
7) 필터링 확인
날짜
수치
필드 : 시트의 좌측에는 가져온 데이터의 목록
차원 : 필드의 상단
측정값 : 필드의 하단
해당 필드에서 데이터를 더블클릭하면 자동으로 열과 행이 지정되고 데이터시각화가 진행된다.
페이지, 필터, 마크에서 여러 설정을 할 수 있는데, 데이터시각화는 마크 카드에서 주로 이루어진다.
마크 카드 영역의 다양한 시각화 종류들, 원을 선택했을 때 보여지는 시각화
태블로의 하단에서 원본으로 이동, 시트 및 대시보드 이동 및 생성을 할 수 있다.
차원
- 정성적 값(예: 이름, 날짜, 지리적 데이터 등)을 포함합니다. 차원을 사용하여 데이터의 세부 정보를 분류하고 나누고 표시할 수 있습니다. 차원은 뷰의 세부 수준에 영향을 미칩니다.
측정값
- 측정할 수 있는 정량적 수치 값을 포함합니다. 측정값을 집계할 수 있습니다. 측정값을 뷰에 끌어 놓으면 Tableau가 (기본적으로) 해당 측정값에 집계를 적용합니다.
출처 : Tableau 공식 사이트
해당 필드의 상단은 차원, 하단은 측정값이 위치해 있다.
여기서 차원에 "Row ID"는 수치데이터임에도 불구하고 차원에 위치해 있는데 그 이유는 해당 데이터는 1씩 증가하는 데이터이기 때문에 Tableau가 차원으로 분류한 것이다.
데이터를 Tableau에 연결하게 되면 자동으로 차원인지 측정값인지 구분하게 된다.
물론 오류가 발생할 수 있다. 차원으로 의도했지만 측정값에 위치해 있거나 그 반대인 경우, 드래그해서 해당위치로 옮겨주면 된다.
데이터를 더블클릭하거나 드래그를 해서 행 필드 또는 행 컬럼에 갖다놓으면 그래프가 생성된다.
데이터 삭제는 클릭하고 delete를 누르거나, 드래그해서 빼기, 클릭해서 메뉴에서 "제거"를 클릭하면 된다.
행에 있는 테이블 앞의 +를 클릭하면 하위 테이블이 생성된다.
아래와 같이 행 또는 열을 지정하고 측정값을 적용하면 다음과 같이 표가 생성된다.
측정값의 "Quantity"를 차원으로 바꾸면 해당 칼럼은 한번에 몇개를 구매하는지에 대한 차원으로 변경되게 된다.
차원의 "Customer ID"를 측정값으로 바꾸면 ID가 아닌 사람 수를 의미하게 된다.
변경된 두 데이터(Customer ID 측정값, Quantity 차원)를 시각화하면 다음과 같다.
이것을 보면 한번에 2개의 제품을 구매하는 사람이 가장 많다는 것을 알 수 있다.
변경전 데이터로 시각화하면 각 사용자의 구매량을 알 수 있다.
ID는 고유값으로 오는 경우가 많으므로 차원으로 인식된다. 따라서 상황에 맞게 속성을 변경할 수 있어야 한다.
불연속형(차원) : 파란색
연속형(측정값) : 초록색
열에 주문일자를, 행에 합계를 넣는다.
컨트롤 드래그로 주문일자를 필터에 복사해서 넣고 "년" -> "2020"을 선택한다.
이 상태에서 주문일자 앞의 + 를 눌러서 하위영역(분기)을 생성한다.
마지막까지 하위영역을 생성해서 일별로 표기하면 다음과 같다. 하지만 의도했던 차트가 아니다.
작업한 시트의 우클릭해서 "복제"를 선택해서 시트를 생성한다.
열을 초기 주문일자로 되돌리고 메뉴에서 하단의 일을 선택한다. (상단의 년,분기,월,일은 불연속형이고 하단은 연속형이다)
연속형 결과 확인
Sub-Category를 ctrl 드래그에서 마크 카드의 색상에 드롭하면 다음과 같이 색상이 부여된다.
불연속형인 데이터를 받은 경우 여러색상을 사용한다.
Sales를 ctrl 드래그에서 마크 카드의 색상에 드롭하면 다음과 같이 색상이 부여된다.
연속형인 데이터를 받은 경우 단일색상의 진한정도(그라데이션)를 사용한다.