자료의 종류와 특성
통계분석 방법은 자료의 속성과 분석 목적에 따라 달라짐
- 분석방법의 적절성: 분석하고자 하는 자료가 분석방법에서 가정한 조건을 얼마나 만족하는지에 따라 분석방법의 적절성이 결정 => 자료의 속성에 따른 분류 필요
변수(variable) ; 변량(variate)
- 일변량 자료(univariate data): 하나의 변수만 있는 자료
- 다변량 자료(multivariate data) : 여러 개의 변수로 이루어짐 -> 변수들 간 관련성이 있을 수도 없을 수도 있음
관측개체(observation) ; 관측값(치)
- 일반적으로 기초통계학에서는 관측 개체들 간 관련성이 없다고 봄 -> 각각의 관측개체가 독립적인 관계
자료의 분류
속성에 따른 자료의 분류
범주형 자료 (categorial data)
- 명목형 자료 (nominal data)
숫자로 바꾸어도 그 값이 크고 작음을 나타내는 것이 아니라 단순히 범주를 표시
예) 성별 (주민번호), 혈액형
- 순서형 자료 (ordinal data)
범주의 순서가 상대적으로 비교 가능
예) 비만도 (저체중, 정상, 과체중, 비만, 고도비만), 학점, 선호도
-> 대부분 수치형 자료를 그룹화 하여 순서형 자료로 바꿈
수치형 자료 (numerical data)
- 이산자료 (discrete data)
셀 수 있는 형태의 자료(countable data)
예) 멤버의 수
- 연속자료 (continuous data)
연속적인 속성을 가지는 자료
(1) 연속자료는 대부분 이산화를 통해 절사된 형태로 표시 (절사: 숫자를 일정 단위 이하를 잘라서 버림)
(2) 척도에 따라 명목, 순서, 구간, 비율척도로 나눔
예) 신장, 체중 -> 연속자료는 이산화를 통해 자연수 형태로 표시되는 경우가 많음