# .sum

4개의 포스트
post-thumbnail

Pandas기초-4. 통계함수

count() : 데이터 갯수 mean() : 평균 std() : 표준편차 min() : 최솟값 max() : 최대값 변수.describe() 전반적으로 .describe 함수는 모든 값을 보여줌. > 전반적인 수치형(num값) 컬럼에 대한 모든 수치를 통계표를 보여준다. (include='object') 문자열 >> 문자열 컬럼에 대한 통계표를 보여주기 위해선, 해당 문구 추가 ![](https://velog.velcdn.com/images/beckhye/post/cd4ef9c9-ac2f-42e

2023년 8월 12일
·
0개의 댓글
·
post-thumbnail

[혼공머신] 6-3. 주성분 분석

Intro. 🚨고객들이 보낸 과일 사진이 너무 많아지면서, 저장공간이 부족해졌다... 업로드된 사진의 용량을 좀 압축시킬 수는 없을까? 1. 차원 축소 '차원'이라는 용어 지금까지 우리는 데이터가 가진 속성을 '특성'이라고 불렀음. (ex. 과일 사진의 각 샘플은 10,000개의 특성으로 이루어짐) 머신러닝에선 이 '특성'을 '차원'이라고도 부름. > ⭐다차원 배열과 1차원 배열에서 용어가 다르게 쓰임. 다차원 배열 : 차원 = 축의 개수 / 1차원 배열(벡터) : 차원 = 원소의 개수 ❗지금 '차원 축소'에서 축소한다는 차원은 후자❗ (벡터로서의 차원) 차원 축소 비지도학습의 한 종류로, **데이터를 가장 잘 나타내는 일부

2023년 2월 3일
·
0개의 댓글
·
post-thumbnail

14. 그룹화

동일한 값을 가진 것들끼리 합쳐서 평균 등의 통계를 계산하기 위해 '그룹화'를 사용한다. "다소 복잡하니 복습 잘 하시길!!" 데이터 준비 (이전과 동일) 그룹화 by 학교 .groupby() : 입력된 카테고리에서 같은 값끼리 그룹으로 묶어줌. .get_group() : 입력된 그룹의 데이터를 출력해줌. .mean() : 계산 가능한 데이터들의 평균값을 "그룹 별로" 계산해줌. ![](https://velog.velcdn

2023년 1월 10일
·
0개의 댓글
·
post-thumbnail

05. 데이터 확인

실제 데이터는 훨씬 방대해서 한 눈에 들어오지 않는다. 그러니 구체적인 정보들을 요약해서 확인할 줄 알아야 한다. 데이터 준비 (이전 차시에 저장했던 파일 활용) DataFrame 확인 .describe() : 계산 가능한 데이터에 대해 Column 별로 요약통계치를 보여줌. .info() : Column 별로 데이터의 기본 정보들을 보여줌.

2023년 1월 9일
·
0개의 댓글
·