# visualization

folium 서울시 지도 시각화
folium은 지도 시각화를 하는데 강력한 도구이다. 이 folium으로 어디까지 활용할 수 있을지, 빅데이터와 folium의 활용의 무궁무진함을 꾸준히 기록하려고 한다.가장 먼저 folium의 기본적인 기능부터 시작해서 다양한 API와 라이브러리 들을 함께 사용하여
데이터 시각화 라이브러리 설치
시각화 라이브러리 Getting started matplotlib seaborn plotly cufflinks bokeh pandas bokeh pyecharts [altair](https://altair-viz.github.io/g
7-1. Custom Matplotlib Teme
apple에서 제공하는 가이드라인에서 색을 가져와서 matplotlib의 색을 apple의 색으로 바꾸려 한다.cycler 라이브러리에 있는 cycler 를 활용위에서 선언한 다크모드 색상을 사용해 전체적인 colcormap 변경mpl.rcParams를 활용해 변경사용
6. Interative Visualization
정적 시각화만약 feature가 10개 있다면 각각을 살펴보는데 10개의 plot이 필요하다.각각의 관계를 살펴본다면 10\*9 /2 = 45개의 plot이 필요하며, 가볍게 데이터를 살펴보기에 공간적 낭비가 크다.발표 혹은 설득을 위해서는 원하는 메세지를 압축해서 담
5-3. 다양한 시각화 라이브러리
Missingno결측치를 체크하는 시각화 라이브러리빠르게 결측치의 분포를 확인하고 싶을 때 사용결측치를 matrix로 나타내어 흰 부분으로 표시Waffle Chart와플 형태로 discrete하게 값을 나타내는 차트pie 차트와 기능이 유사하며 전체적으로 데이터의 비율
5-2. Pie Charts
Pie Chart많이 사용되는 차트이지만, 비교하기 어렵고, 유용성이 떨어지기 때문에 지양하는 차트사용을 꼭 하고 싶다면 함께 사용할 것을 권장Pie plot은 값에 대한 비교가 어렵지만, bar plot은 값에 대한 비교가 쉬우므로 적재적소에 잘 사용하면 될 것 같다
5-1. Polar Coordinate
Polar Plot극 좌표계를 사용하는 시각화중심의 거리 r과 거리에서 각도 $\\theta$를 사용하여 시각화회전, 주기성 등을 표현하기에 적합하다단순하게 plot에 projection = polar을 추가하거나 polar=True를 사용하여 scatter,bar,l
4. Seborn
SeabornMatplotlib 기반 통계 시각화 라이브러리로, 구성, 분포, 관계 등 통계적인 정보나 데이터를 살피는데 적합한 라이브러리쉬운 문법과 깔끔한 테마 디자인으로 많은 사람들이 선호일반적으로 import seaborn as sns 로 사용시각화의 목적과 방법
3-4. More Tips
Grid 이해하기default grid기본적인 Grid는 축과 평행한 선을 사용하여 거리 및 값 정보를 보조적으로 제공한다.다른 표현들을 방해하지 않도록 무채색으로 사용하며, 검정색 보다는 회색, 실선보다는 점선으로 사용한다꼭 X, Y축 두 개의 Grid를 사용할 필요
3-3. Facet 사용하기
Facet이란 분할을 의미하는데, 화면 상의 View를 분할 및 추가하여 다양한 관점을 전달한다.같은 데이터셋에 대해 서로 다른 인코딩을 통해 다른 인사이트를 보여 줄 수 있다. ex) 같은 데이터셋에 대해 막대 그래프와 도넛 차트 비교같은 방법으로 동시에 여러 fea
3-2. Color 사용하기
Color가 중요한 이유어떠한 데이터를 구분하는데 있어서 가장 중요한 요소는 위치적 정보이고, 그 다음이 바로 색상이다.사람이 공통적으로 색이 가지는 느낌이 있기 때문에, 색상에 따라 우리의 인사이트를 더 매력적으로 잘 전달할 수 있다.무조건 화려하다고 좋은 것이 아닌
3-1. Text 사용하기
시각화에서 Text가 필요한 이유Visual representation으로 줄 수 없는 설명을 추가할 수 있다.잘못된 전달에서 생기는 오해를 방지할 수 있다.하지만 Text를 과하게 사용하게 된다면 가독성과 이해를 방해할 수 있다.Anatomy of a Figure(T
2-3. Scatter Plot
Scatter Plot흔히 점을 사용하여 두 feature 간의 관계를 알기 위해 사용하며, 산점도라 불린다.scatter는 기본적으로 2차원적인 데이터를 표현하는데, 색, 모양, 크기를 통해 차원을 늘려 갈 수 있다.주로 상관관계를 확인하거나 군집, 값 사이의 차이,
2-2. Line plot
Line plotLine Plot은 연속적으로 변화하는 값을 순서대로 점으로 나타내고, 이를 선으로 연결한 그래프시간/순서에 대한 변화에 적합하여 추세를 살피기 위해 사용하며 시계열 분석에 특화되어 있다.시각화에서 기본적인 plot이기 때문에 .line이 아닌 .plo
2-1. Bar plot
기본적으로 직사각형 막대를 사용하여 데이터의 값을 표현하는 차트/그래프막대 그래프, bar chart, bar graph 등의 이름으로 사용됨범주에 따른 수치 값을 막대로 표현하고 막대들을 서로 비교하는 방법막대의 방향에 따른 분류수직(vertical) : bar()를
1-2. Matplotlib 실습
Maplotlibnumpy와 scipy를 베이스로 하여 다양한 라이브러리와 호환성이 좋다.코드상에서 일반적으로 matplotlib은 줄여서 mpl로 사용한다.기본 plot matplotlib 에서 그리는 시각화는 figure 라는 큰 틀에 ax라는 서브 플롯을 추가해서
1. Data viz
데이터 시각화란?데이터를 그래픽 요소로 매핑하여 시각적으로 표현하는 것데이터를 잘 다룰줄 알아야 하며, 그래픽 요소가 무엇인지 알아야 하고, 데이터가 그래픽 요소를 매핑할 수 있어야 하며 남들이 이해하기 쉽게 전달하고 싶은 내용을 잘 전달하는 것시각화의 Task목적 :

데이터 시각화! Visualization 하기_3 plot 사용법
앞서 figure() 객체 생성, add_subplot()으로 서브플롯을 생성하여 plot을 그렸습니다. 하지만 plt.plot() 명령어를 통해 그래프를 그리면 matplotlib는 가장 최근의 figure객체와 서브플롯을 그리게 됩니다. np.linspace(0

[Tableau] 도넛 차트
🍩 도넛 차트 도넛 차트는 파이 차트의 일종으로, 카테고리별 또는 그룹별로 집계를 하고 이를 백분율로 표시할 때 자주 사용된다. 도넛 차트는 데이터 간의 비율을 직관적으로 나타내주는 동시에, 데이터 전체에 대한 정보까지 담을 수 있다. 데이터 제주데이터허브에서 제공

Line Charts
Ref: Kaggle Data Visualization Course2017 ~ 2018 Spotify의 Daily streams 인턴십때 Line plot은 일반적으로 x축에 Time Series, y축에 집계량을 표현하는 것이다는 피드백을 받았다. 항상 Plot을 그