단변량분석-숫자형

김범주·2024년 9월 18일
0

AIVLE

목록 보기
7/21
post-thumbnail
#데이터의 형태 별 분석에 쓰이는 값과 시각화 방법(외워두기!)
#기초통계량 수치화
시리즈명.describe() or 데이터프레임.describe()
시리즈는 그 열의 기초통계량
데이터프레임은 숫자타입 변수들 기초통계량 
(include = 'all')를 사용하면 전체 변수들의 기초통계량
#시각화
Histogram
plt.hist(데이터프레임명[열 이름], bins = n, edgecolor = '색상명')
bins는 구간의 개수, 지금은 5로 지정했으므로 5개의 구간이 보임
edgecolor나 x,y label은 옵션
결과를 저장하면 numpy array에 빈도 수와 구간 값이 저장됨
#시각화
Density Plot(밀도함수 그래프)
sns.kdeplot(데이터프레임명[열 이름])
#시각화
Box Plot
값에 NAN이 있으면 그려지지 않음! (but seaborn으로 그리면 자동으로 빼줌)
plt.boxplot(데이터프레임명[열 이름], vert=True/False) vert=False면 가로로
sns.boxplot(x/y = 데이터프레임명[열 이름]) x인지 y인지로 가로세로 결정
#시계열 데이터 시각화
시계열 데이터는 x축에 시간을 두고 라인차트로 표현
profile
개발꿈나무

0개의 댓글