본 내용은 인프런 강의 <데이터 분석을 위한 판다스>를 수강하며 중요한 점을 정리한 글입니다.
How to calculate summary statistics
Aggregating statistics
한 개의 컬럼을 기준 컬럼으로 사용하는 GROUP BY할 경우
titanic.groupby('Sex')['Age'].mean()
->
Sex
female 27.915709
male 30.726645
Name: Age, dtype: float64
여러개의 컬럼을 기준 컬럼으로 사용하는 GROUP BY할 경우
titanic.groupby(['Pclass', 'Sex'])['Fare'].mean()
-> Pclass Sex
1 female 106.125798
male 67.226127
2 female 21.970121
male 19.741782
3 female 16.118810
male 12.661633
Name: Fare, dtype: float64