시리즈명.describe() or 데이터프레임.describe()
시리즈는 그 열의 기초통계량
데이터프레임은 숫자타입 변수들 기초통계량
(include = 'all')를 사용하면 전체 변수들의 기초통계량
Histogram
plt.hist(데이터프레임명[열 이름], bins = n, edgecolor = '색상명')
bins는 구간의 개수, 지금은 5로 지정했으므로 5개의 구간이 보임
edgecolor나 x,y label은 옵션
결과를 저장하면 numpy array에 빈도 수와 구간 값이 저장됨
Density Plot(밀도함수 그래프)
sns.kdeplot(데이터프레임명[열 이름])
Box Plot
값에 NAN이 있으면 그려지지 않음! (but seaborn으로 그리면 자동으로 빼줌)
plt.boxplot(데이터프레임명[열 이름], vert=True/False) vert=False면 가로로
sns.boxplot(x/y = 데이터프레임명[열 이름]) x인지 y인지로 가로세로 결정
시계열 데이터는 x축에 시간을 두고 라인차트로 표현
