데이터 분석 - 6

CYSSSSSSSSS·2023년 8월 16일
0

데이터분석

목록 보기
9/19

범주형 변수 분석

  • 범주별 빈도수를 세는 경우가 많다 (pd.value_counts())

  • 범주별 비율을 만든다 (각각의 개수를 / 전체 개수로 나눠라 )

Bar Plot

Series.value_counts(nomarlize = False)

  • 시리즈의 값들의 빈도를 체크
  • normalize 를 True 로 바꾸면 일반화 (빈도수 의 비율화) 로 바꿔주는 작업을 한다.

sns.countplot

sns.countplot(x = 'Embarked' , data = titanic , order = [])
  • 범주별 빈도수를 계산 (value_counts())
  • bar plot 으로 나타냄
  • order 를 통해 그래프 에 보여지는 차트의 순서를 작성할수 있다.

plt.bar

  • 범주별 빈도수를 직접 계산한 결과를 입력해야 범주별 빈도가 barplot 으로 그려짐

Pie chart

plt.value_counts()
plt.pie(value , labels = index , autopct = '%.2f%%')
  • autopct : 소수점 몇번쨰까지 출력할것인지
  • index : 해당 퍼센트가 무엇으로 나타낼것인지
  • value : value_counts() 나타낸 빈도의 값
profile
개발자 되고 싶어요

0개의 댓글