8장1절: 사회현상의 요약설명

Johnny Lee·2022년 10월 27일
0

확률과 통계

목록 보기
15/15

산포도구하는것이 문제에 나왔는데 어렵지는 않았음

사회현상의 설명

  • 빈도.도수 분석
    - 도수분포표 (frequency table)
    - 도수분포곡선(frequency curve)

사회현상의 요약
- 현상의 요약 도구
a. 현상을 대표하는 수
b. 현상의 변화정도 파악

1. 자료{현상}의 요약

• 대표값/중신화경향(measures of location 혹은 central tendency)
○ 자료를 요약(대표)하는 수, 어떠한 수치를 중심으로 자료가 분포되었는가 나타냄 평균등
예1) 기말 경영.경제학 시험 반 평균: 100점 만점에 82점
2. 자료현상의 변화정도 파악
• 산포도(measures of dispersion/spread 혹은 variability) 시험에 나옴
○ 자료의 변화여부와 변화정도를 표현하는 도구,자료가 어느 정도 산포되어(흩어져)있는지를 나타냄

8장2절 기술통계분석결과는 어떻게 해석하는가?

1.빈도 분석
• 검토
○ 228명의 대학생을 대상으로 설문조사를 실시한 결과 중 응답자의 연령의 빈도를 SPSS Statistics 로 분석한 결과(도수분포표)
• 시스템 결측값
○ 전체 응답자 228면 중 3명은 연령에 관한 문항에 대답을 하지 않았고 이 것이 '시스템 결측값'이라는 행(row)에 제시됨
2.대푯값:현상의 요약
• 대푯값은 자료수집시 사용된 척도의 유형(사용된 숫자가 보유한 특젱에 따라)에 따라 상이

1) 명목척도와 대푯값
• 최빈값(mode) //제일 많이 언급된 값
○ 명목척도 측정 현상의 대푯값
○ 최고의 빈도(frequency)를 가지는 값 혹은 집단을 지칭
• 원칙적으로 남성과 여성응답자가 25명씩 동수로 존재하는 경우에 최빈값은 존재하지 않는 것으로 해석한다.
2) 서열척도과 대푯값 //시험문제에 나올 가능성 높음
• 중앙값(median)
○ 서열로 측정된 현상을 요약해 주는 대푯값
○ 모든 응답치의 중아에 해당되는 값(value)
§ 변량의 수를 n이라 할 때, 홀수인 경우는 (n+1) /2 번째 변량의 값, 짝수인 경우는 가운데 있는 두 변량을 산술평균한 값으로 함.
Ex) (25,34,23,22,21,20) 의 중앙값은 22.5 순서중요
3) 등간척도/비율척도와 대푯값
• 평균(mean)
○ 자료가 등간척도 혹은 비율척도로 측정된 경우에 이러한 자료를 요약해주는 대푯값
○ 모든 응답자의 응답값을 더하고 이를 모든 응답자의 수로 나누어서 구함

3. 산포도: 현상의 변화정도

• 자료요약(descriptive summary)의 좀더 중요한 목적은 조사 대상 사회현상이 변화는 현상인지의 여부와, 변화한다면 변화폭은 어느 정도인지를 알아보는 것
• 변화여부/폭 판단 기준
○ 범위,편차,분산 등
1) 범위(range)
- 최대응답값과 최소응답값의 차이, n이 작은 경우가 값이 안정되므로 n이10또는 (20)이하일 때 많이 쓰임 ex)공업제품의 품질관리-제품을 만들고 분량이
- N이 너무 크면 분포 범위의 크기는 불안정하게 됨
2) 편차(deviation)
- 개인의 응답값에서 평균을 차감한 수(x=Xi - X)
->편차는 응답자의 수만큼 존재
-> 대표적인 편자는 어떻게 정ㅐ야 하는지의 문제 발생
예) 편차의 합, 편차들의 평균?
*편차개념의 단점: 경우에 따라 실제로 존재하는 변화폭의 크기를 보여주지 못한다는 단점이 있어 다른 산포도 도구가 개발됨

3) 분산

  1. 분산의 구분
    • 분산(vairance)
    ○ 평균으로부터 개별 응답값들이 '평균적으로' 얼마나 벌어져 있는지를 요약해 주는 도구
    ○ 편차제곱은 합을 응답자지수 (정확하게는 "응답자수-1"로 나눔)로 나누어서 산출
    ->분산은 ㅏ나만 존재
    분산은 기술통계는 물론 추리통계에서도 중요한 역할을 수행

    • 분모를 n-1로 나누는 이유

    • 표본분산은 모분산보다 변동폭이 약간 작은 경향이 있기 때문
      -> 포본분산이 모분산에 접근하도록 할 수 있기 때문
      → S^2 이 모분산 σ^2 의 불편추정량이 되기 위해서

• 분산의 장점
○ 현상의 변화방향과는 상관없이 현상의 변화폭이 존재하는 양이 비례해서 분산의 크기 결정됨
-> 현상의 변화을 대표적으로 쉽게 파악할 수 있는 도구
• 분산의 단점
○ 분산이 편차의 '제곱'으로 표현되기 때문에 실제로 응답이 측정이 단위보다 매우 큰 숫자로 표현이 된다는 점
-> 실제 측정단위를 기준으로 어느 정도의 변화폭이 존재하는지에 대한 직관적인 답을 줄 수 없다는 점

*분산의 구분->측정대상 현상의 변화 + 다른 현상의 변화
• 모분산 vs 표본분산
• 층분산 = 체계적 분산 + 비체계적 분산

• 공분산(covariance) 시험에 나옴

○ 하나의 변수가 변함에 따라 다른 변수가 어떤 방향으로 얼마나 변화하는가를 보여주는 도구
• 분산과 공분산은 현상의 변화폭 혹은 현상들간의 관계를 요약해 줌
• 분산과 공분산은 많은 통계분석기법의 척추와 같은 역할을 수행

4) 표준편차

• 포준편차
○ 분산에 제곱근을 적용하여 얻어지는 수
• 표준편차의 장점
○ 분산의 장점을 그대로 보유하되, 현상의 측정단위와 동일한 단위로 표현된 변화폭 설명도구
• 왜도: 정상분포곡선이 좌우로 기울어진 정도, 정상분포의 경우 값이 0임, 분포곡선이 정상분포대비 좌측으로 기울어지면 값으로, 우측으로 기울어지면 값으로 나타냄
첨도: 정상분포곡선이 완만 혹은 뾰족한 편인지 의미, 정상분포의 경우 이 값이 0임, 뽀족한 편일수록 + 값으로 완만한, 편일수록 값으로 나타냄

  • 분산과 표준편차의 유용성
  • 분산은 평균으로부터의 편차 값을 이용하여 ㅖ산되므로 평균값과는 독립적으로 계산됨
    - 미분이 가능한 점 등 수학적 조작이 간편함
    - 주어진 자료의 모든 값을 사용하여 계산하며, 분산의 값은 자료의 조그마한 변화에도 아주 민감함
    - 한 그룹의 관측치들이 특정한 분포를 따를 때에 분포되어 있는 정도에 대한 훌륭한 정보를 제공할 수 있음
    - 분산은 일단 편차를 제곱하는 과정을 거치므로 편차가 큰 것일수록 제곱함으로써 일종의 평가를 가중하게 함
    -> 여러가지 자료에서 오차가 커진다 거나 기대 값으로부터 멀어져 위험부담이 커질 때에, 이를 가능한 회피하고자 할 필요가 있을 때 분산과 표준편차가 유용하게 사용될 수 있을 것임

8장3절: 기술통계분석은 어떻게 실행하는가? 안중요함

• 어떤 통계분석이든 분석대상 자료를 열어 놓고 진행할 필요가 있음
• SPSS Statistics 를 이용한 기술통계분석은
○ Main메뉴에서 분석-> 기술통계량->빈도분석 혹은 분석->기술통계량->기술통계를 선택해서 수행하게 됩니다.
• SPSS main 메뉴 중 빈도분석메뉴 혹은 기술통계메뉴 사용 가능

  1. 빈도분석메뉴
    1) 빈도분석메뉴시작방법
    • 분석대상 자료파일을 불러옴
    • 다음에서와 같이 SPSS main 메뉴중 분석(A) -> 기술통계량(E)-> 빈도분석(F)을 선택
    2) 빈도분석메뉴 실행방법
    • 위에서 설명한 빈도분석 관련 옵션을 설정한 다음에는 창으로

8장4절: 기술통계분석과 다른 통계분석간의 관계

1) 기술통계분석과 추리통계분석

• 기술통계분석(descriptive statistics)
○ 수에 대한 설명의 목적을 가진 통계분석
• 추리통계분석
○ 표본에서의 변수간의 관계가 모집단에서도 성립하는지를 추론하는 목적을 가진 통계분석
○ 기술통계가 추리통계의 기초를 제공

2) 모수통계분석과 비모수통계분석

• 모수통계(parametric statistics)
○ 현상이 등간척도 혹은 비율척도로 측정되어 모집단의 특성에대한 정보가 충분하기 떄문에 표본통계량으로 모수추정이 가능한 통계분석기법
• 비모스통계
○ 현상이 명목척도나 서열척도로 측정되어 ㅗ집단의 분포형태나 모수의 특징을 추론해 내기 어려운 경우에 사용하는 분석기법

3) 단일변량통계분석과 다변량통계분석

• 단변량 통계분석(univariate statistics)
○ 하나의 변수를 대상으로 하는 통계분석
-> 기술통계 중심

• 다변량 통계분석(multivariate statistics)
○ 두개 이상의 변수들을 대상으로 하는 통계분석
-> 추측 통계가 주측

profile
You can always be better

0개의 댓글