# .count

4개의 포스트
post-thumbnail

Pandas기초-4. 통계함수

count() : 데이터 갯수 mean() : 평균 std() : 표준편차 min() : 최솟값 max() : 최대값 변수.describe() 전반적으로 .describe 함수는 모든 값을 보여줌. > 전반적인 수치형(num값) 컬럼에 대한 모든 수치를 통계표를 보여준다. (include='object') 문자열 >> 문자열 컬럼에 대한 통계표를 보여주기 위해선, 해당 문구 추가 ![](https://velog.velcdn.com/images/beckhye/post/cd4ef9c9-ac2f-42e

2023년 8월 12일
·
0개의 댓글
·
post-thumbnail

03. 캐글 설문조사 분석하기

캐글에서 실시한 설문조사 내용을 시각화해보고 간단히 분석해보려 한다. 박조은 님의 인프런 강좌를 기반으로 한 내용이다. " 캐글에선 해마다 설문조사가 올라옵니다. 세계적으로 어떤 기술들이 많이 쓰이는지 등 현황을 볼 수 있어 데이터사이언스 공부를 시작하는 사람들이 보면 도움이 됩니다." 캐글 소개 캐글은 전 세계 데이터 전문가들이 경쟁하는 플랫폼이다. : 다양한 경진대회. 상금, 상, 리크루팅 등의 보상 있음. : 다양한 데이터셋 제공. 코로나 데이터 인기 많았음. : 다른 사람들의 분석사례를 볼 수 있음. 'most votes'로

2023년 1월 25일
·
0개의 댓글
·
post-thumbnail

14. 그룹화

동일한 값을 가진 것들끼리 합쳐서 평균 등의 통계를 계산하기 위해 '그룹화'를 사용한다. "다소 복잡하니 복습 잘 하시길!!" 데이터 준비 (이전과 동일) 그룹화 by 학교 .groupby() : 입력된 카테고리에서 같은 값끼리 그룹으로 묶어줌. .get_group() : 입력된 그룹의 데이터를 출력해줌. .mean() : 계산 가능한 데이터들의 평균값을 "그룹 별로" 계산해줌. ![](https://velog.velcdn

2023년 1월 10일
·
0개의 댓글
·
post-thumbnail

05. 데이터 확인

실제 데이터는 훨씬 방대해서 한 눈에 들어오지 않는다. 그러니 구체적인 정보들을 요약해서 확인할 줄 알아야 한다. 데이터 준비 (이전 차시에 저장했던 파일 활용) DataFrame 확인 .describe() : 계산 가능한 데이터에 대해 Column 별로 요약통계치를 보여줌. .info() : Column 별로 데이터의 기본 정보들을 보여줌.

2023년 1월 9일
·
0개의 댓글
·