seaborn graph 종류
- barplot
- countplot
- scatterplot : relplot (카테고리 O), lmplot (회귀선 O)
- lineplot
- heatmap
- pie
- boxplot : swarmplot (중복 X, 분포 O), stripplot (중복 O, 분포 O), violinplot (boxplot + swarmplot + 선)
- (distplot) & histplot & displot & jointplot
distplot는 미래에는 없어질 그래프이기 때문에, 사용을 지양하자.
(1) countplot : data, x(또는 y), hue, palette
groupby를 이용하면 카테고리 별로 나눠서 볼 수 있다.
(2) scatterplot : 산점도, 위치가 필요하기 때문에 x,y 모두 필요하다.
scatterplot 관련 그래프
- relplot : 카테고리 O, 카테고리 별로 나눠서 그릴 수 있다. (col, row : 행과 열에 기준을 넣어주면 카테고리 별로 그래프를 그릴 수 있다.)
- lmplot : 회귀선 O
(3) lineplot : 점과 점을 이어주는 그래프
x눈금을 더 추가하여 지정해주기. palette, style 등등이 있다.
(4) heatmap : cmap, annot, fmt("d":정수)
🌈 heatmap을 사용하기 전에, pivot table로 변경한 뒤 heatmap 이용하기!
subplots document에 grid_kws 있다. subplots로 나눈 후에, 밑에 있는 도화지에 colorbar를 그릴 수 있다. (colorbar 부분을 작게 만들 수도 있다.)
(5) pie : label, textprop & dict (색깔 지정하고 싶은 경우), colors, explode (따로 떼어내고 싶은 경우), autopct (그래프 위에 퍼센트 나타내고 싶은 경우) 등등 많다.
plt.pie(df["원하는 칼럼명"])
colors=color_list # 리스트 안에 넣어주기.
explode=explode_list # 리스트 안에 넣어주기.
(6) boxplot
boxplot 관련 그래프
- swarmplot : 분포 O, 중복 X (분산, 얼마나 잘 퍼져 있는지 알 수 있다.)
- stripplot : 분포 O, 중복 O
- violinplot : boxplot + swarmplot + 선 (데이터 분포를 알 수 있다.)
(7) distplot : 밀도를 표기하는 함수
하지만, 미래에는 없어질 함수라서 warning이 뜬다.
(8)번 그래프를 이용해서 그릴 예정이다.
좋은 점 : 자동적으로 구간을 나누어서 보여주기 때문에 편리하다. 다른 그래프는 데이터를 나눠줘야 한다.
(8) displot & histplot : 두 개의 함수는 사용법이 거의 비슷하다. (kde, stat 등등) 분포를 그릴 때 유용하다.
displot 크기 조정
sns.set(rc={"figure.figsize":(n,m)}) 작동하지 X.
- height : 세로
- aspect
width : 가로 = aspect x height
(9) jointplot = << histplot + 밀도 >> 한꺼번에 표현할 수 있다.
(10) pandas-profiling : EDA (Exploratory Data Analysis) 탐색적 데이터 분석
코드 없이 결과를 볼 수 있다.
오늘도 못함.. 미루지 말기.. 리액트부터 꼭 내일부터 시작하기. 저녁에는 무조건 프론트엔드 공부하기.