4. 데이터 시각화

YJ·2023년 9월 29일
0

데이터 시각화

  • 많은 양의 데이터의 분포 및 특성을 알아내기 위해 사용

Matplotlib

기본적인 차트들을 쉽게 그릴 수 있도록 도와주는 시각화 라이브러리

  • Line Plot: plt.plot(x)
  • Bar: plt.bar(x, height) (범주형 데이터)
  • Pi
  • Histogram: plt.hist(x) (기본 구간 값 10)
  • Box Plot: plt.boxpolt(x)
  • Scatter Plot: plt.scatter(x, y)

관련 함수

  • plt.figure(): 시각화 영역 지정
  • plt.plot(): 시각화할 차트의 종류 및 값 지정
  • plt.show(): 출력

Seaborn

matplotlib 기반으로 만들어진 통계 데이터 시각화 라이브러리

  • 목적에 따라 Matplotlib, Seaborn 각각 다르게 사용 가능함

  • Seaborn이 Matplotlib보다 시각적으로 강화된 모습

  • scatterplot: sns.scatterplot(x, y) (두 값의 상관관계)

  • catplot: sns.catplot(x, y, col/row) (3개 이상 카테고리 값에 의한 분포 변화)

  • lmplot: sns.lmplot(x, y) (산점도 + 회귀선)

  • countplot: sns.Countplot(x) (항목 별 갯수) (연속형, 범주형 변수에 모두 적용 가능)
    (sns.histplot은 연속형 변수에만 적용 가능)

  • jointplot: sns.jointplot(x) (산점도 + countplot)

  • boxplot: sns.boxplot(x, y) (수치적 자료)

  • violinplot: sns.violinplot(x, y) (boxplot과 유사 + 밀집도)

  • heatmap: sns.heatmap(data) (데이터의 배열을 색상으로 표현) (데이터가 연속적이어야 함)

profile
💻귀찮으니 필요할 때만 쓰는 Computer Vision 일지 ㅇㅇ💻

0개의 댓글