산포도구하는것이 문제에 나왔는데 어렵지는 않았음
사회현상의 설명
사회현상의 요약
- 현상의 요약 도구
a. 현상을 대표하는 수
b. 현상의 변화정도 파악
• 대표값/중신화경향(measures of location 혹은 central tendency)
○ 자료를 요약(대표)하는 수, 어떠한 수치를 중심으로 자료가 분포되었는가 나타냄 평균등
예1) 기말 경영.경제학 시험 반 평균: 100점 만점에 82점
2. 자료현상의 변화정도 파악
• 산포도(measures of dispersion/spread 혹은 variability) 시험에 나옴
○ 자료의 변화여부와 변화정도를 표현하는 도구,자료가 어느 정도 산포되어(흩어져)있는지를 나타냄
1.빈도 분석
• 검토
○ 228명의 대학생을 대상으로 설문조사를 실시한 결과 중 응답자의 연령의 빈도를 SPSS Statistics 로 분석한 결과(도수분포표)
• 시스템 결측값
○ 전체 응답자 228면 중 3명은 연령에 관한 문항에 대답을 하지 않았고 이 것이 '시스템 결측값'이라는 행(row)에 제시됨
2.대푯값:현상의 요약
• 대푯값은 자료수집시 사용된 척도의 유형(사용된 숫자가 보유한 특젱에 따라)에 따라 상이
1) 명목척도와 대푯값
• 최빈값(mode) //제일 많이 언급된 값
○ 명목척도 측정 현상의 대푯값
○ 최고의 빈도(frequency)를 가지는 값 혹은 집단을 지칭
• 원칙적으로 남성과 여성응답자가 25명씩 동수로 존재하는 경우에 최빈값은 존재하지 않는 것으로 해석한다.
2) 서열척도과 대푯값 //시험문제에 나올 가능성 높음
• 중앙값(median)
○ 서열로 측정된 현상을 요약해 주는 대푯값
○ 모든 응답치의 중아에 해당되는 값(value)
§ 변량의 수를 n이라 할 때, 홀수인 경우는 (n+1) /2 번째 변량의 값, 짝수인 경우는 가운데 있는 두 변량을 산술평균한 값으로 함.
Ex) (25,34,23,22,21,20) 의 중앙값은 22.5 순서중요
3) 등간척도/비율척도와 대푯값
• 평균(mean)
○ 자료가 등간척도 혹은 비율척도로 측정된 경우에 이러한 자료를 요약해주는 대푯값
○ 모든 응답자의 응답값을 더하고 이를 모든 응답자의 수로 나누어서 구함
• 자료요약(descriptive summary)의 좀더 중요한 목적은 조사 대상 사회현상이 변화는 현상인지의 여부와, 변화한다면 변화폭은 어느 정도인지를 알아보는 것
• 변화여부/폭 판단 기준
○ 범위,편차,분산 등
1) 범위(range)
- 최대응답값과 최소응답값의 차이, n이 작은 경우가 값이 안정되므로 n이10또는 (20)이하일 때 많이 쓰임 ex)공업제품의 품질관리-제품을 만들고 분량이
- N이 너무 크면 분포 범위의 크기는 불안정하게 됨
2) 편차(deviation)
- 개인의 응답값에서 평균을 차감한 수(x=Xi - X)
->편차는 응답자의 수만큼 존재
-> 대표적인 편자는 어떻게 정ㅐ야 하는지의 문제 발생
예) 편차의 합, 편차들의 평균?
*편차개념의 단점: 경우에 따라 실제로 존재하는 변화폭의 크기를 보여주지 못한다는 단점이 있어 다른 산포도 도구가 개발됨
분산의 구분
• 분산(vairance)
○ 평균으로부터 개별 응답값들이 '평균적으로' 얼마나 벌어져 있는지를 요약해 주는 도구
○ 편차제곱은 합을 응답자지수 (정확하게는 "응답자수-1"로 나눔)로 나누어서 산출
->분산은 ㅏ나만 존재
분산은 기술통계는 물론 추리통계에서도 중요한 역할을 수행
• 분모를 n-1로 나누는 이유
• 분산의 장점
○ 현상의 변화방향과는 상관없이 현상의 변화폭이 존재하는 양이 비례해서 분산의 크기 결정됨
-> 현상의 변화을 대표적으로 쉽게 파악할 수 있는 도구
• 분산의 단점
○ 분산이 편차의 '제곱'으로 표현되기 때문에 실제로 응답이 측정이 단위보다 매우 큰 숫자로 표현이 된다는 점
-> 실제 측정단위를 기준으로 어느 정도의 변화폭이 존재하는지에 대한 직관적인 답을 줄 수 없다는 점
*분산의 구분->측정대상 현상의 변화 + 다른 현상의 변화
• 모분산 vs 표본분산
• 층분산 = 체계적 분산 + 비체계적 분산
○ 하나의 변수가 변함에 따라 다른 변수가 어떤 방향으로 얼마나 변화하는가를 보여주는 도구
• 분산과 공분산은 현상의 변화폭 혹은 현상들간의 관계를 요약해 줌
• 분산과 공분산은 많은 통계분석기법의 척추와 같은 역할을 수행
• 포준편차
○ 분산에 제곱근을 적용하여 얻어지는 수
• 표준편차의 장점
○ 분산의 장점을 그대로 보유하되, 현상의 측정단위와 동일한 단위로 표현된 변화폭 설명도구
• 왜도: 정상분포곡선이 좌우로 기울어진 정도, 정상분포의 경우 값이 0임, 분포곡선이 정상분포대비 좌측으로 기울어지면 값으로, 우측으로 기울어지면 값으로 나타냄
첨도: 정상분포곡선이 완만 혹은 뾰족한 편인지 의미, 정상분포의 경우 이 값이 0임, 뽀족한 편일수록 + 값으로 완만한, 편일수록 값으로 나타냄
• 어떤 통계분석이든 분석대상 자료를 열어 놓고 진행할 필요가 있음
• SPSS Statistics 를 이용한 기술통계분석은
○ Main메뉴에서 분석-> 기술통계량->빈도분석 혹은 분석->기술통계량->기술통계를 선택해서 수행하게 됩니다.
• SPSS main 메뉴 중 빈도분석메뉴 혹은 기술통계메뉴 사용 가능
• 기술통계분석(descriptive statistics)
○ 수에 대한 설명의 목적을 가진 통계분석
• 추리통계분석
○ 표본에서의 변수간의 관계가 모집단에서도 성립하는지를 추론하는 목적을 가진 통계분석
○ 기술통계가 추리통계의 기초를 제공
• 모수통계(parametric statistics)
○ 현상이 등간척도 혹은 비율척도로 측정되어 모집단의 특성에대한 정보가 충분하기 떄문에 표본통계량으로 모수추정이 가능한 통계분석기법
• 비모스통계
○ 현상이 명목척도나 서열척도로 측정되어 ㅗ집단의 분포형태나 모수의 특징을 추론해 내기 어려운 경우에 사용하는 분석기법
• 단변량 통계분석(univariate statistics)
○ 하나의 변수를 대상으로 하는 통계분석
-> 기술통계 중심
• 다변량 통계분석(multivariate statistics)
○ 두개 이상의 변수들을 대상으로 하는 통계분석
-> 추측 통계가 주측