질적자료 vs양적자료
자료의 구분: 수치 차이
더하고, 빼고, 곱하고, 나누는 사칙연산 가능 여부에 따라 자료를 질적 자료(Qualitative Data)와 양적 자료(Quantitative Data)로 나눌 수 있다.
질적자료 (=범주형 자료)
명목형 자료(Nominal Data)
-문자로 나타내어지는 자료
-범주간 순서가 없음
-예 : 혈액형, 직업의 종류(전문직, 회사원, 공무원 등), 성별
순서형 자료(Ordinal Data)
-문자로 나타내어지는 자료이나 범주들 간 순서가 있는 자료
-사칙 연산을 할 수 없음
-예 : 선호도, 학점
양적자료(=숫자형 자료)
이산자료
연속자료
-절대 영점이 있고 비율 계산이 가능한 자료
-예 : 체중, 키, 무게, 상품의 판매량
⭐️자료배열이란?
무질서하게 수집한 자료를 작은 값에서 큰 값 순으로 또는 큰 값에서 작은 순으로 정돈하는 것을 의미
도수분포표란?
수집한 자료를 자료의 특성을 기준으로 일정한 계급(class)으로 나누고, 각 계급에 속하는 자료의 도수(frequency)를 대응하여 작성한 표를 도수분포표(frequncy distribution table)
1)도수(frequency) : 어떤 범주에 속하는 자료의 수
2) 도수분포표(frequency distribution table) : 범주별 도수를 정리한 표
도수분포표(Frequency Distribution)란?
범주형 자료(명목형 자료, 순서형 자료)
숫자형 자료
도수분포표 관련 용어
계급(Class)
계급값(Class mark)=평균값, 중간값
도수/빈도(Frequency)
상대도수: 각 계급에 속한 도수의 비율
/N
누적 도수(Cumulative Frequency)
누적 상대 도수(Cumulative Relative Frequency)
bins array
계급수
1+log(도수,2)
계급간격
범위/계급수
지금까지 살펴본 도수, 상대도수, 누적도수, 누적상대도수의 관계를 정리하면 [표 1-3]과 같다.
이때 계급의 간격은 일정해야 하며, 각 계급 구간은 중복되지 않아야 한다. 계급을 읽을 때는 ai이상, ai+1미만과 같이 ‘이상’, ‘미만’을 붙인다
엑셀 정리
최소값:min(범위)
최대값:max(범위)
범위=최대 - 최소
도수: n수 = count(범위)
도수:frequency(집합범위, 간격범위)
FREQUENCY(data_array, bins_array)
data_array : 빈도를 계산할 값 집합의 참조 또는 배열
bins_array : 값을 분류할 구간 값
계급수:1+log(도수,2)
계급간격:범위[최대-최소]/계급수
계급값:sum[계급시작+계급끝]/2
셀위치 고정
F4 =>$