[통계] 일변량 자료 기술통계_1. 자료의 분류와 특성

김고은·2022년 9월 22일
0

통계학

목록 보기
4/7

자료의 종류와 특성

통계분석 방법은 자료의 속성과 분석 목적에 따라 달라짐

  • 분석방법의 적절성: 분석하고자 하는 자료가 분석방법에서 가정한 조건을 얼마나 만족하는지에 따라 분석방법의 적절성이 결정 => 자료의 속성에 따른 분류 필요

변수(variable) ; 변량(variate)

  • 일변량 자료(univariate data): 하나의 변수만 있는 자료
  • 다변량 자료(multivariate data) : 여러 개의 변수로 이루어짐 -> 변수들 간 관련성이 있을 수도 없을 수도 있음

관측개체(observation) ; 관측값(치)

  • 일반적으로 기초통계학에서는 관측 개체들 간 관련성이 없다고 봄 -> 각각의 관측개체가 독립적인 관계

자료의 분류

속성에 따른 자료의 분류

범주형 자료 (categorial data)

  • 명목형 자료 (nominal data)
    숫자로 바꾸어도 그 값이 크고 작음을 나타내는 것이 아니라 단순히 범주를 표시

예) 성별 (주민번호), 혈액형

  • 순서형 자료 (ordinal data)
    범주의 순서가 상대적으로 비교 가능

예) 비만도 (저체중, 정상, 과체중, 비만, 고도비만), 학점, 선호도
-> 대부분 수치형 자료를 그룹화 하여 순서형 자료로 바꿈

수치형 자료 (numerical data)

  • 이산자료 (discrete data)
    셀 수 있는 형태의 자료(countable data)

예) 멤버의 수

  • 연속자료 (continuous data)
    연속적인 속성을 가지는 자료

(1) 연속자료는 대부분 이산화를 통해 절사된 형태로 표시 (절사: 숫자를 일정 단위 이하를 잘라서 버림)
(2) 척도에 따라 명목, 순서, 구간, 비율척도로 나눔

예) 신장, 체중 -> 연속자료는 이산화를 통해 자연수 형태로 표시되는 경우가 많음

profile
veloger

0개의 댓글