[Data Viz] 시각화의 요소

hyunsooo·2022년 10월 6일

Contents

  1. 데이터 이해하기
    1.1 데이터 시각화
    1.2 데이터셋의 종류
    1.3 데이터의 종류

  2. 시각화 이해하기
    2.1 마크와 채널
    2.2 전주의적 속성

데이터 이해하기

1.1 데이터 시각화

  • 데이터 시각화를 위해서는 데이터가 우선적으로 필요

  • 시각화를 진행할 데이터

    1. 데이터셋 관점 (global)
    2. 개별 데이터의 관점 (local)
  • 어떤 데이터들이 있는지, 어떤 내용을 전달할 수 있을지 확인하기

1.2 데이터셋의 종류

  • 정형 데이터

    • 테이블 형태로 제공되는 데이터로 일반적으로 csv, tsv파일

    • Row가 데이터 1개 item

    • Column은 attribute(feature)

    • 통계적 특성과 feature 사이 관계를 나타내기 좋음

    • 데이터 간 관계, 데이터 간 비교 가능

  • 시계열 데이터

    • 시간 흐름에 따른 데이터를 Time-Series라고 한다.

    • 기온, 주가 등 정형데이터와 음성, 비디오와 같은 비정형 데이터 존재

    • 시간 흐름에 따른 추세(Trend), 계절성(Seasonality), 주기성(Cycle) 등을 살핌

  • 지리 데이터

    • 지도 정보와 보고자 하는 정보 간의 조화가 중요하다.

    • 지도 정보를 단순화 시키는 경우도 존재

    • 거리, 경로, 분포 등 다양하게 사용가능 함

  • 관계형(네트워크) 데이터

    • 객체와 객체 간의 관계를 시각화 (Graph, Network Visualization)

    • 객체는 Node로 관계는 Link로 표현할 수 있다.

    • 크기, 색, 수 등으로 객체와 관계의 가중치를 표현

    • 휴리스틱하게 노드 배치를 구성

  • 계층적 데이터

    • 관계 중에서도 포함관계가 분명한 데이터

    • Tree, Treemap, Sunburst등이 대표적이다.

  • 다양한 비정형 데이터


데이터의 종류는 다양하게 분류 가능

  • 대표적으로 4가지로 분류

    • 수치형(numerical)

      • 연속형(continuous): 길이, 무게, 온도 등
      • 이산형(discrete): 주사위 눈금, 사람 수 등
    • 범주형(categorical)

      • 명목형(nominal): 혈액형, 종교 등
      • 순서형(ordinal): 학년, 별점, 등급 등

시각화 이해하기

2.1 마크와 채널

  • A mark is a basic graphical element in an image

    • 점, 선, 면으로 이루어진 데이터 시각화
  • A visual channel is a way to control the appearance of marks, independent of the dimensionality of the geometric primitive.

    • 각 마크를 변경할 수 있는 요소들
    • Position, Color, Shape, Size 등

전주의적 속성

  • 변경시킬 수 있는 요소 중 우리가 주의를 주지 않아도 인지하게 되는 요소
  • 동시에 사용하면 인지하기 어려움

  • visual pop-out(시각적 분리)를 잘 사용하는 것이 중요

  • 기울기, 길이, 두께, 크기, 모양, 곡선, 색 등

profile
지식 공유

0개의 댓글