실제 데이터는 훨씬 방대해서 한 눈에 들어오지 않는다. 그러니 구체적인 정보들을 요약해서 확인할 줄 알아야 한다.

  • 데이터 준비 (이전 차시에 저장했던 파일 활용)

DataFrame 확인

  • .describe() : 계산 가능한 데이터에 대해 Column 별로 요약통계치를 보여줌.
  • .info() : Column 별로 데이터의 기본 정보들을 보여줌.
  • .head() : 데이터의 처음 부분 확인 / .tail() : 데이터의 끝 부분 확인
  • .values, .index, .columns, .shape 등으로 다양한 정보를 확인할 수 있음.

Series 확인

  • DataFrame을 구성하는 Series에 대해서도 다양한 정보를 확인할 수 있음.
  • .min() : 최소값 / .mean() : 평균값 / .sum() : 총합
    .nlargest(): 가장 큰 값 / .count() : 유효한 데이터 개수
    .unique() : (중복을 제외한) 고유값 / .nunique() : 고유값 개수
profile
생각은 그만

0개의 댓글