산점도로 범주형 변수 시각화 및 서브플롯 시각화

매일 공부(ML)·2022년 2월 13일
0

학습 목표

범주형 변수의 산점도를 표현하는 다양한 방법을 알아봅니다.

서브플룻을 그리는 catplot알아보기


핵심 키워드

scatterplot

stripplot

swarmplot

catplot

kind: bar, point, box, violin, strip, swarm


Point

범주형 변수의 산점도를 scatterplot으로 표현하면 같은 곳에 점이 여러 개 찍혀서 값을 제대로 표현하기 어렵기에 범주형 데이터의 산점도를 표현할 때는 stripplot 을 사용하면 점을 흩어지게 그리게 됩니다. 하지만 이 그래프 역시 데이터가 많으면 점이 겹쳐 보이게 되는데 이 단점을 보완한 시각화가 swarmplot 입니다.


Code로 보기

*scatterplot

# scatterplot 으로 범주형 변수 그리기
sns.scatterplot(data=df, x="origin", y="mpg")

*stripplot

# stripplot
sns.stripplot(data=df, x="origin", y="mpg")

*swarmplot

# swarmplot
plt.figure(figsize=(10,4))
sns.swarmplot(data=df, x="origin", y="mpg", size=3)

*catplot

catplot 은 범주형 데이터의 서브플롯을 그릴 때 사용하고 기본 값은 stripplot이며 아래 catplot 을 통해 kind 값을 지정해 bar, point, box, violin, strip, swarmplot을 시각화 할 수 있습니다.


code

# catplot
sns.catplot(data= df, x = "origin", y="mpg")

# catplot 으로 boxplot그리기
# catplot
sns.catplot(data= df, x = "origin", y="mpg", col= "cylinders", col_wrap = 3, kind="box")

# catplot 으로 violinplot그리기
# catplot
sns.catplot(data= df, x = "origin", y="mpg", col= "cylinders", col_wrap = 3, kind="violin")

# catplot 으로 countplot그리기
# catplot
sns.catplot(data= df, x = "origin", col= "cylinders", col_wrap = 3, kind="count")

# catplot 으로 boxplot그리기
# df 전체를 넣고 시각화 하기
sns.catplot(data= df, kind="box", aspect=3)

# catplot 으로 violinplot그리기
# df 전체를 넣고 시각화 하기
sns.catplot(data= df, kind="violin", aspect=3)

profile
성장을 도울 아카이빙 블로그

0개의 댓글