# visualization

68개의 포스트
post-thumbnail

folium 서울시 지도 시각화

folium은 지도 시각화를 하는데 강력한 도구이다. 이 folium으로 어디까지 활용할 수 있을지, 빅데이터와 folium의 활용의 무궁무진함을 꾸준히 기록하려고 한다.가장 먼저 folium의 기본적인 기능부터 시작해서 다양한 API와 라이브러리 들을 함께 사용하여

2022년 5월 14일
·
0개의 댓글

데이터 시각화 라이브러리 설치

시각화 라이브러리 Getting started matplotlib seaborn plotly cufflinks bokeh pandas bokeh pyecharts [altair](https://altair-viz.github.io/g

2022년 5월 13일
·
0개의 댓글

7-1. Custom Matplotlib Teme

apple에서 제공하는 가이드라인에서 색을 가져와서 matplotlib의 색을 apple의 색으로 바꾸려 한다.cycler 라이브러리에 있는 cycler 를 활용위에서 선언한 다크모드 색상을 사용해 전체적인 colcormap 변경mpl.rcParams를 활용해 변경사용

2022년 5월 11일
·
0개의 댓글

6. Interative Visualization

정적 시각화만약 feature가 10개 있다면 각각을 살펴보는데 10개의 plot이 필요하다.각각의 관계를 살펴본다면 10\*9 /2 = 45개의 plot이 필요하며, 가볍게 데이터를 살펴보기에 공간적 낭비가 크다.발표 혹은 설득을 위해서는 원하는 메세지를 압축해서 담

2022년 5월 11일
·
0개의 댓글

5-3. 다양한 시각화 라이브러리

Missingno결측치를 체크하는 시각화 라이브러리빠르게 결측치의 분포를 확인하고 싶을 때 사용결측치를 matrix로 나타내어 흰 부분으로 표시Waffle Chart와플 형태로 discrete하게 값을 나타내는 차트pie 차트와 기능이 유사하며 전체적으로 데이터의 비율

2022년 5월 11일
·
0개의 댓글

5-2. Pie Charts

Pie Chart많이 사용되는 차트이지만, 비교하기 어렵고, 유용성이 떨어지기 때문에 지양하는 차트사용을 꼭 하고 싶다면 함께 사용할 것을 권장Pie plot은 값에 대한 비교가 어렵지만, bar plot은 값에 대한 비교가 쉬우므로 적재적소에 잘 사용하면 될 것 같다

2022년 5월 11일
·
0개의 댓글

5-1. Polar Coordinate

Polar Plot극 좌표계를 사용하는 시각화중심의 거리 r과 거리에서 각도 $\\theta$를 사용하여 시각화회전, 주기성 등을 표현하기에 적합하다단순하게 plot에 projection = polar을 추가하거나 polar=True를 사용하여 scatter,bar,l

2022년 5월 11일
·
0개의 댓글

4. Seborn

SeabornMatplotlib 기반 통계 시각화 라이브러리로, 구성, 분포, 관계 등 통계적인 정보나 데이터를 살피는데 적합한 라이브러리쉬운 문법과 깔끔한 테마 디자인으로 많은 사람들이 선호일반적으로 import seaborn as sns 로 사용시각화의 목적과 방법

2022년 5월 11일
·
0개의 댓글

3-4. More Tips

Grid 이해하기default grid기본적인 Grid는 축과 평행한 선을 사용하여 거리 및 값 정보를 보조적으로 제공한다.다른 표현들을 방해하지 않도록 무채색으로 사용하며, 검정색 보다는 회색, 실선보다는 점선으로 사용한다꼭 X, Y축 두 개의 Grid를 사용할 필요

2022년 5월 11일
·
0개의 댓글

3-3. Facet 사용하기

Facet이란 분할을 의미하는데, 화면 상의 View를 분할 및 추가하여 다양한 관점을 전달한다.같은 데이터셋에 대해 서로 다른 인코딩을 통해 다른 인사이트를 보여 줄 수 있다. ex) 같은 데이터셋에 대해 막대 그래프와 도넛 차트 비교같은 방법으로 동시에 여러 fea

2022년 5월 11일
·
0개의 댓글

3-2. Color 사용하기

Color가 중요한 이유어떠한 데이터를 구분하는데 있어서 가장 중요한 요소는 위치적 정보이고, 그 다음이 바로 색상이다.사람이 공통적으로 색이 가지는 느낌이 있기 때문에, 색상에 따라 우리의 인사이트를 더 매력적으로 잘 전달할 수 있다.무조건 화려하다고 좋은 것이 아닌

2022년 5월 11일
·
0개의 댓글

3-1. Text 사용하기

시각화에서 Text가 필요한 이유Visual representation으로 줄 수 없는 설명을 추가할 수 있다.잘못된 전달에서 생기는 오해를 방지할 수 있다.하지만 Text를 과하게 사용하게 된다면 가독성과 이해를 방해할 수 있다.Anatomy of a Figure(T

2022년 5월 11일
·
0개의 댓글

2-3. Scatter Plot

Scatter Plot흔히 점을 사용하여 두 feature 간의 관계를 알기 위해 사용하며, 산점도라 불린다.scatter는 기본적으로 2차원적인 데이터를 표현하는데, 색, 모양, 크기를 통해 차원을 늘려 갈 수 있다.주로 상관관계를 확인하거나 군집, 값 사이의 차이,

2022년 5월 11일
·
0개의 댓글

2-2. Line plot

Line plotLine Plot은 연속적으로 변화하는 값을 순서대로 점으로 나타내고, 이를 선으로 연결한 그래프시간/순서에 대한 변화에 적합하여 추세를 살피기 위해 사용하며 시계열 분석에 특화되어 있다.시각화에서 기본적인 plot이기 때문에 .line이 아닌 .plo

2022년 5월 11일
·
0개의 댓글

2-1. Bar plot

기본적으로 직사각형 막대를 사용하여 데이터의 값을 표현하는 차트/그래프막대 그래프, bar chart, bar graph 등의 이름으로 사용됨범주에 따른 수치 값을 막대로 표현하고 막대들을 서로 비교하는 방법막대의 방향에 따른 분류수직(vertical) : bar()를

2022년 5월 11일
·
0개의 댓글

1-2. Matplotlib 실습

Maplotlibnumpy와 scipy를 베이스로 하여 다양한 라이브러리와 호환성이 좋다.코드상에서 일반적으로 matplotlib은 줄여서 mpl로 사용한다.기본 plot matplotlib 에서 그리는 시각화는 figure 라는 큰 틀에 ax라는 서브 플롯을 추가해서

2022년 5월 11일
·
0개의 댓글

1. Data viz

데이터 시각화란?데이터를 그래픽 요소로 매핑하여 시각적으로 표현하는 것데이터를 잘 다룰줄 알아야 하며, 그래픽 요소가 무엇인지 알아야 하고, 데이터가 그래픽 요소를 매핑할 수 있어야 하며 남들이 이해하기 쉽게 전달하고 싶은 내용을 잘 전달하는 것시각화의 Task목적 :

2022년 5월 11일
·
0개의 댓글
post-thumbnail

데이터 시각화! Visualization 하기_3 plot 사용법

앞서 figure() 객체 생성, add_subplot()으로 서브플롯을 생성하여 plot을 그렸습니다. 하지만 plt.plot() 명령어를 통해 그래프를 그리면 matplotlib는 가장 최근의 figure객체와 서브플롯을 그리게 됩니다. np.linspace(0

2022년 5월 6일
·
0개의 댓글
post-thumbnail

[Tableau] 도넛 차트

🍩 도넛 차트 도넛 차트는 파이 차트의 일종으로, 카테고리별 또는 그룹별로 집계를 하고 이를 백분율로 표시할 때 자주 사용된다. 도넛 차트는 데이터 간의 비율을 직관적으로 나타내주는 동시에, 데이터 전체에 대한 정보까지 담을 수 있다. 데이터 제주데이터허브에서 제공

2022년 5월 1일
·
0개의 댓글
post-thumbnail

Line Charts

Ref: Kaggle Data Visualization Course2017 ~ 2018 Spotify의 Daily streams 인턴십때 Line plot은 일반적으로 x축에 Time Series, y축에 집계량을 표현하는 것이다는 피드백을 받았다. 항상 Plot을 그

2022년 4월 26일
·
0개의 댓글