11주차 - Tableau 1_04. 테블로를 통한 간단한 데이터 전처리(1,2)

HA_·2023년 12월 11일
post-thumbnail

11주차 - Tableau 1_04. 테블로를 통한 간단한 데이터 전처리(1)

1. 데이터 결합

데이터 결합에는 크게 두 가지가 있음.
(1) Union (데이터 통합)
(2) Join (특정 키 값을 가지고 두 테이블을 결합)


(1) Union (데이터 통합)
한 테이블의 행을 다른 테이블에 추가하여 두 개 이상의 테이블을 결합할 수 있음.

방법

  • 시트에 있는 테이블 지정 후 데이터를 [데이터 준비]에 있는 데이터로 끌고 옴.

  • 그러면 '유니온'이라는 옵션이 나타나게 되고, 그곳에 데이터를 두면 됨!

  • 유의점!
    유니온으로 원하는 결합을 원하는 경우 유니온을 사용하여 결합하는 테이블의 구조가 같아야 데이터가 정확히 통합됨!(각 테이블의 필드 수가 같고, 관련 필드에 필드 이름과 데이터의 유형이 일치해야 함)

유니온이 되었는지 확인하는 방법

현재 테이블에서 마우스 우클릭 - [유니온 편집]
하게 되면 어떤 테이블이 유니온되었는지 확인할 수 있음!

cf) 여기서 테이블을 드래그하여 가져옴으로써 추가하거나 삭제할 수 있음!

(2) Join (특정 키 값을 가지고 두 테이블을 결합)

방법

  • 로지컬 테이블 더블클릭
    아래의 테이블 즉, 사용하기 위해 [데이터 준비]에 가져다 놓은 테이블을 로지컬 테이블이라고 함.

    더블클릭하게 되면 다음과 같은 화면이 된다.

  • 조인하려는 시트(여기서는 Return 시트)를 드래그해서 오른쪽으로 가져다 놓으면 다이어그램이 표시되고, 테블로에서 자동적으로 inner join으로 테이블을 연결함.
    중간에 다이어그램을 클릭하면 조인 유형을 변경할 수 있음!

  • 조인을 사용할 경우 조인절을 설정해야 함!
    테블로에서는 기본적으로 같은 필드명이 존재할 경우 자동으로 키 값을 잡아줌!
    현재는 'Order ID'를 키 값으로 연결된 데이터!

  • 이렇게 조인이 되고 나면 조인이 된 결과를 데이터 그리드에서 미리보기로 볼 수 있고, 가장 오른쪽에 추가된 필드를 볼 수 있음!

[조인 전]
22개의 필드

[조인 후]
24개의 필드
(2개의 필드가 추가됨)


cf) 로지컬 테이블과 피지컬 테이블의 차이!

로지컬 테이블

  • 각 시트 및 테이블 간의 관계를 관계만을 설정
  • 두 테이블의 공통 필드를 기반으로 서로 관련된 방식을 설명하지만, 테이블을 하나로 물리적 병합을 하진 않음

결론적으로 관계는 조인과 비슷하지만, 큰 차이가 있음! 조인은 데이터를 물리적으로 결합해서 하나의 테이블로 만드는 것이고, 관계는 데이터를 물리적으로 결합하진 않음!


2. 데이터 편집

1. 데이터 필드명 변경

  • 필드명 더블클릭 후 수정

2. 데이터 타입 변경

데이터 타입을 선택하여 원하는 형태로 쉽게 변경할 수 있음.

3. 필터

분석에 필요하지 않은 데이터 범위에 대해서 필터링하여 데이터를 축소하고자 함. 데이터 원본에 필터를 적용하여 데이터를 축소시키면 테블로 작업 시 속도를 향상시킬 수 있어 볼륨이 큰 데이터 사용 시 불필요한 데이터 범위를 자르는 전처리 작업이 필요!

방법

  • 오른쪽 상단 [필터] - [추가] 선택
  • [데이터 원본 필터 편집]창에서 [추가] 선택
  • 아래의 화면에서 추가하고자 하는 필드 선택
  • 이렇게 항목 선택이 나오는데, 보고자 하는 항목 선택 후 [확인]버튼 선택
    선택한 항목만 필터링 돼서 볼 수 있음.

반대로, 항목 선택 후 [제외]를 누르면 항목 선택한 값을 제외하고 볼 수 있음.

cf) 문자 타입을 선택할 경우 항목으로 표시되지만,
날짜 타입을 선택할 경우 년, 분기, 월 등으로 필터 적용이 가능함.
날짜 타입은 범위 선택이 가능함.
측정 값 형태 또한 구간 선택이 가능함.

0개의 댓글