데이터 분석 - 11

CYSSSSSSSSS·2023년 8월 18일
0

데이터분석

목록 보기
15/19

숫자 -> 범주

  • kdeplot 을 통해 판단을 하는것이다 .
  • common_norm = False 옵션과 multiple = 'fill'
  • 시각화 는 kde plot 을 그리는 데 group 별로 그렸다.

그래프 해석

  • 두개의 그래프가 접촉 하는 부분은 전체 평균과 같은 지점이다.

  • 그래프를 해석 할때는 전체 평균과 같은 지점이기 떄문에 해석 할떄도 전체 평균 보다 크다 작냐 로 해석해야 한다.

  • 밀도를 1을 기준으로 하고 각각 겹쳐서 그린것이다.

  • 만약 그래프가 다른 그래프보다 높다면 전체 평균 보다 높다 라고 해석하면 된다

  • ex) 18세 미만 사람들은 전체 평균 보다 사망률이 높다.

kdeplot()

  • X 축이 숫자형 변수
  • Y 축이 범주형 변수이다.
sns.kdeplot(x='Age', data = titanic, hue ='Survived', 
            common_norm = False)
plt.show()

sns.kdeplot(x='Age', data = titanic, hue ='Survived'
            , multiple = 'fill')
plt.axhline(titanic['Survived'].mean(), color = 'r')
plt.show()

profile
개발자 되고 싶어요

0개의 댓글