[DevLog TIL] 데이터 시각화와 인포그래픽

Laziest Workaholic·2022년 6월 14일
0

DIGITAL MARKETING

목록 보기
14/24

220614 AIPM과정 D065

대구 AI 스쿨 시작한지 65일차

💻 Study Progress데이터 시각화와 인포그래픽

1. 데이터 시각화

시각화란

데이터를 쉽고 빠르게 이해할 수 있도록 시각적 개체로 표현하는 것

시각화 종류

비교 Comparison
공간 Geo Spatial
추이 Trend
비중 Composition
관계 Relationship
상호관계에 따라 positive/negative
분포 Distribution

그래프를 통한 시각화가 필요한 이유

데이터의 Trend를 빠르게 파악하고 세부 분석에 대한 ‘가설’을 세울 수 있다.
데이터 분석을 통한 Insight 를 공유할 때, 실 숫자를 공유하는 것보다 그래프 를 통한 공유가 더 효과적이다.

데이터 분석가 Career path

데이터분석가 : 데이터를 분석해서 인사이트 도출 및 적용에 초점
데이터 시각화 전문가 : 데이터 시각화 툴을 사용한, ‘데이터 시각화’ 전문가
데이터 엔지니어 : 데이터 파이프라인 구성을 통하여, 데이터 기반 Platform 제작
머신러닝 전문가 : 머신러닝 알고리즘 설계 및 적용 전문가 등…

시각화가 필요한 시점

데이터 분석을 시작하고 나서 Skimming(초기) 단계 및 중간 분석단계에서
데이터 분석가라고 하더라도 전체 view에 대해 데이터를 눈으로 보는 것 만으로 이해할 수 없음.
Overview 단계에서 추출한 데이터는 데이터의 대표성과 사이즈 등 전체적인 시 각 정도를 제공할 뿐 “어떤 방식으로 데이터를 분석해야 할지”에 대해서는 빠르 게 그래프를 그려보아야 쉽게 접근할 수 있음
이 경우, histogram을 통해 데이터의 분포를 알아보거나/ 주요한 분석대상 데이터에 대해 원 그래프를 그려서 비율을 알아보는 등의 작업을 초기에 수행하게 됨
데이터 분석이 끝나고 나서 최종 리포트를 만들 때
데이터 분석은 분석가가 만드는 것으로 끝나지 않음. 많은 유관자들과 함께 ‘논의’를 하 여 인사이트가 액션으로 연결되어야 의미가 있음. 이를 위해 데이터에 대한 ‘명확한 이 해’를 할 수 있게 하기 위해 그래프가 필요함

적합한 차트 형식 고르기


(이미지 출처: https://medium.com/@DataPlay/selecting-the-right-chart-for-your-data-501af25dc693)

기본 그래프

Stacked Bar graph : 추세과 기여를 동시에 표현하고자 할 때
line graph : 선형 그래프(Line Graph)는 데이터 포인트 하나하나에 대한 구 체적 정보다는 연속적인 데이터 흐름이나 추세를 표현할 때 사용
Pie graph: 해당 지표의 Share를 표현하고자 할 때
특정 지표에 대한 Group 별 기여도를 표현하고자 할 때 효과적인 그래프
예제: 2021년 01월 각 팀별 매출 기여도

심화 그래프

Box Plot: 중앙값과 사분위수를 활용한 데이터의 ‘분포’ 파악
Scatter graph(산포도): 데이터가 흩어져 있는 정도를 통한 상관관계 파악
두 지표 x와 y 간 상관관계를 알고자 할 때 효과적 으로 사용할 수 있는 그래프
국민 1인당 GDP와 기대수명 간 상관관계
Waterfall graph : 항목별 수익-지출 등 positive / negative 기여를 나타내는 그래프
항목별 수익 및 지출 등 Positive / Negative 기여를 동시에 표현해야 할 때 효과적인 그래프 형식
예제: A사의 2020년 수익 – 지출 Graph
Tree-map Graph: 그룹별 기여도를 표현할 때 사용
그룹별 기여도를 표시할 때 효과적인 그래프 형식
상자의 크기가 해당 그룹의 기여도 크기를 뜻함
A Company group 의 자회사별 매출 기여도 Graph

시각화를 활용한 분석 기법

Funnel(깔때기) Analysis:특정 목표를 달성을 위한 유저행동을 단계별로 분석하는 데이터 분석 방법
Funnel(깔때기) Analysis
각 단계별로 사용자가 떠나가기 때문에 아래로 갈 수록 좁아지는 깔때기 형태의 graph가 됩니다
퍼널 분석의 이해
퍼널 분석은 특정 목표 달성을 위한 사용자 행동을 단계별로 분석하는 데 이터 분석 방법하며 일반적으로 퍼널 분석은 AARRR 구조기반으로 분석함
Funnel(깔때기) Analysis 3단계
최종 목표 설정
깔때기 단계 설정
단계별 이탈률 측정
Cohort Analysis: 특정기간 비슷한 이용자 그룹간의 차이를 분석하는 방법
Cohort Analysis
Cohort :특정 기간 동안 같은 특성을 가진 사용자 집단
Cohort Analysis: 특정 기간 동안 같은 특성을 가진 사용자를 그룹으로 나 눠서 분석하는 방법
Cohort 기준 잡기
사용자를 나누는 기준이 중요한데, 보편적으로 가입일 기준으로 cohort analysis를 실시
사용자들이 요일별로사용패턴이있기때문에daily로는 분석X
Cohort Analysis 실시
같은 달에 가입한 사용자들이 하나의 Cohort를 이루게 됨(1월 가입자 Cohort, 2월 가입자 Cohort 등)
Retention은 절대값이 아닌 백분율로 표현하면 가입월별 n개월 리텐션을 비 교하기 쉬워짐

인포그래픽의 이해

인포그래픽이란?

인포메이션그래픽(Information graphics) 또는 인포그래픽 (Infographics), 뉴스 그래픽 (News graphics)은 정보, 자료 또는 지식의 시각적 표현이다. 정보를 구체적, 표면적, 실용적으로 전달한다는 점에서 일반적인 그림이나 사진 등과는 구별된다. 복잡한 정보를 빠르고 명확하게 설명해야하는 기호, 지도, 기술 문서 등에서 사용된다. 차트, 사실박스, 지도, 다이어그램, 흐름도, 로고, 달력, 일러스트레이션, 텔레비전 프로그램 편성표 등이 인포그래픽에 포함된다.
인포그래픽은 복잡한 정보를 이해하기 쉽게 시각화하여 효과적으로 전달하는 시각적 표현이다.

왜 인포그래픽인가?

방대한 정보를 효과적으로 빠르게 전달
시각적 효과를 통한 기억력 상승
방대한 정보의 보관과 관람 용이

인포그래픽 유형

통계 기반 인포그래픽
일반적인 유형
숫자로 된 데이터를 기반으로 표나 그래픽을 이용하여 만들어짐
타임라인 기반 인포그래픽
시간 순서대로 정보를 보여주는 형태
기업이나 제품의 역사, 프로젝트 일정 등 시간성을 가진 정보 표현할 때 효과적
시간의 흐름에 따라 선 형태로 표현하는 경우가 많으며 문자, 선, 숫자, 레이블 등을 디자인 요소로 활용
프로세스 기반 인포그래픽
여러가지 형상이 서로 연관성을 갖고 진행되는 일의 과정을 이해하기 쉽게 한장으로 표현
복잡한 업무 처리 과정이나 무엇인가를 만드는 과정을 보여줄 때 효과적
위치, 지리 기반 인포그래픽
정보를지도위에나타내는것이일반적
국가별지역별로비교할때, 건물층별안내도를보여줄때, 학문영역범위를나타낼때효과적
비교 형식 인포그래픽
서로 상반되는 데이터를 대조 및 비교함으로써 그 상태를 더욱 선명하게 드러냄
강력한 설득과 이해를 이끌어야 할 때 효과적

실무에서 필요한 인포그래픽의 역할

입체적인 정보 구성
실무에서의 다양한 Stake Holder • 다양한 관계/경험/과정이 존재, 확장
임팩트 있는 내용 전달
업무관계자들과의 협업/협의 필수적
정보, 매체에 알맞은 결과물은 빠른 이해와 원만한 합의를 이루는데 도움
경제적인 데이터 정리
문서의 페이지가 많아질수록 이해 하는수고도늘어남

인포그래픽 예시/실무에서 필요한 인포그래픽의 유형

흐름 Flow

단계를 표현하기 위한 유형
선형/순환형/발산형/수렴형 등 다양한 형태로 표현 가능
선형으로 표현할 경우 ‘축(axis)’을 어떻게 의미있게 정의하고 흐름안에 잘 녹이느냐가 중요

관계 Relation

사람과 환경, 사람과 제품, 사람과 사람 등 데이터 안에 형성된 상호 관계를 시각화
관계를 찾는 것 자체도 중요하지만 연결 고리속에 숨어있는 의미를 발견하는 것이 중요

구조 Structure

계층을 표현하거나 연속적으로 확장이 일어나는 데이터를 시각화
구조가 확장될 때에는 동일 선상에 있는 데이터의 레벨을 맞추는 것이 중요

재현/모델링 Modeling

물리적인 환경, 제품, 인물의 특징, 시나리오 등을 컨셉이나 특징에 맞게 시각화
실제 환경을 화면속에 담기 어려워서 그래픽으로 재현하는 것이기 때문에 일정 수준 이상의 사실성을 부여하는 것이 중요

정량데이터 Quantitative Data

Raw data를의미있게 가공하여 시각화
가장 중요한 원칙은 명료성을 지켜 데이터의 의미를 드러내는데 주력하는 것

데이터, 사실, 수치를 표현할 때 지켜야 할 기본 원칙

데이터 시각화의 중요성

데이터 중심 사회
통계 리터러시
차트와 그래프 작성 능력

인포그래픽의 세가지 핵심 요소

콘텐츠
흡인력 있는 시각화
정교한 실천

차트로 그릴 가치가 있는 정보를 정확하게 표현한다

자료조사: 신뢰할 수 있는 자료를 사용한다
편집: 핵심 메시지를 찾고 부각시킨다
구성: 적합한 차트 유형과 차트 구성요소를 선택한다
검토: 원본 자료와 비교하고 이치에 맞는지 독자 관점에서 점검

데이터 시각화 작성 순서

목표 세우기
데이터 이해하기
시각화 방법 선택하기
디자인 시각화
검토하기

차트의 기본 구성 요소

숫자
모든 사실을 전달한다
핵심을 짚어 낸다
순수하게 가독성을 고려한다
색상
효과적인 데이터 표현에 대한 전략이다

똑똑하게 차트 그리기

막대
개별 수량을 나타낸다
수평 막대
수량에 대한 순위를 매긴다

연속적인 데이터 흐름을 표현한다
파이차트
전체에서 차지하는 비중을 보여준다

인포그래픽을 위한 정보 시각화 방법

전략적 목표 세우기
콘텐츠를 소비하는 사람이 누구인가?
전달하고자 하는 핵심 메시지는 무엇인가?
전달 방식은 무엇인가?
정보수집
직접 리서치 하기
정보 제공 받기
정보 가공
정보 필터링
정보 구조화
디자인(+검토)
Visual Hook을 표현하라
리듬감을 부여하라
심플함을 유지하라

인포그래픽 사이트

인포그래픽스
http://info-graphicskr/
비주얼다이브
http://www.visualdive.com/
바이스버사 디자인 스튜디오
http://www.v-vdesign.com/

인포그래픽 제작 툴

Tableau
http://www.tableau.com
망고보드
http://www.mangoboard.net
Demo-Data Studio
https://datastudio.google.com/u/0/navigation/reporting

출처: 김형진교수님 특강 중 이름모를 강사님

profile
laaaaaaaaziest workaholic

0개의 댓글