[통계] 일변량 자료에 대한 수치적 기술통계_1. 수치자료 분포의 중심위치
평균
1. 표본 평균 (sample mean)
표본의 합을 표본 크기로 나눈 값
1-1. 무게 중심
- n개의 자료 중 x1, ..., xm가 a보다 작다고 가정
즉, 무게 중심은 "평균"을 의미함.
편차
편차의 합 = 0
1-2. 표본비율 (sample proportion)
- i번째 관측값이 관심 범주에 속하면 xi의 값을 1, 속하지 않으면 0으로 표시
- y = x1 + ... + xn : 해당 범주에 포함된 표본의 수
- 표본비율 = 표본평균.
이상점 (outlier)
- 대부분의 관측값들로부터 멀리 떨어져 있는 일부 관측값
- 이상점의 포함 여부에 따라 표본평균의 값에 차이가 크게 나는 경향이 있음
=> 이상점에 로버스트 하지 않음
- 대체 통계값: 중앙값, 절사평균, 최빈값
가중평균 (weighted mean)
기하평균 (geometric mean)
조화평균 (harmonic mean)