# .mean

4개의 포스트
post-thumbnail

Pandas기초-4. 통계함수

count() : 데이터 갯수 mean() : 평균 std() : 표준편차 min() : 최솟값 max() : 최대값 변수.describe() 전반적으로 .describe 함수는 모든 값을 보여줌. > 전반적인 수치형(num값) 컬럼에 대한 모든 수치를 통계표를 보여준다. (include='object') 문자열 >> 문자열 컬럼에 대한 통계표를 보여주기 위해선, 해당 문구 추가 ![](https://velog.velcdn.com/images/beckhye/post/cd4ef9c9-ac2f-42e

2023년 8월 12일
·
0개의 댓글
·
post-thumbnail

[혼공머신] 6-1. 군집 알고리즘

Intro. 농산물 시장까지 진출한 한빛마켓! 이젠 고객이 필요한 과일 사진을 보내면, 그게 어떤 과일인지 구별하는 모델이 필요해졌다. 그런데, 손님들이 어떤 과일 사진을 보낼지 알 수 없으니 사진에 대한 정답(타깃)이 없는 거나 마찬가지인데... 이건 어떡해야할까? '타깃이 없다 (=입력 데이터만 있다)' ➡️ 비지도 학습! (플러스알파 참조) 1. 사진 데이터 다루기 데이터 가져오기 넘파이 배열로 저장되어있는 파일을 다운로드 함. ! : 파이썬 코드가 아니라 리눅스 Shell 명령으로 이해하도록 바꿔주는 문자. wget : 웹에서 파일을 다운로드하여 저장하는 명령어 (-O 뒤에는 파일 이름) 다운받은

2023년 2월 3일
·
0개의 댓글
·
post-thumbnail

14. 그룹화

동일한 값을 가진 것들끼리 합쳐서 평균 등의 통계를 계산하기 위해 '그룹화'를 사용한다. "다소 복잡하니 복습 잘 하시길!!" 데이터 준비 (이전과 동일) 그룹화 by 학교 .groupby() : 입력된 카테고리에서 같은 값끼리 그룹으로 묶어줌. .get_group() : 입력된 그룹의 데이터를 출력해줌. .mean() : 계산 가능한 데이터들의 평균값을 "그룹 별로" 계산해줌. ![](https://velog.velcdn

2023년 1월 10일
·
0개의 댓글
·
post-thumbnail

05. 데이터 확인

실제 데이터는 훨씬 방대해서 한 눈에 들어오지 않는다. 그러니 구체적인 정보들을 요약해서 확인할 줄 알아야 한다. 데이터 준비 (이전 차시에 저장했던 파일 활용) DataFrame 확인 .describe() : 계산 가능한 데이터에 대해 Column 별로 요약통계치를 보여줌. .info() : Column 별로 데이터의 기본 정보들을 보여줌.

2023년 1월 9일
·
0개의 댓글
·