2003년 중2 학생을 대상으로 고등학교 졸업 후까지 6년간 매년 추적조사한, 한국청소년패널조사의 데이터로 R프로그램 실습을 진행한 내용이다.
ex1) 1차년도와 2차년도의 '수업참여도(class_parti)' 변수에 대한 두 종속표본 t검증
describe()
, hist()
, boxplot()
로 확인clas_parti_d
)로 치환해서도 확인t.test()
+ paired=True
로 종속표본 t검증 할 수 있음paired=True
옵션 쓰면 안 됨!!)stringAsFactors=T
: 문자열로 입력된 변수(ex. 성별, 학교지역 등)는 범주형으로 설정!ex1) '성별(gender)'에 따른 '성적(grade_re)'의 평균 차이 검증
"남학생 성적과 여학생 성적이 모집단에서 같은가?"
describeBy(A,B)
로 집단별 기술통계 확인 가능 ("A를, B에 따라 describe해줘")hist()
, boxplot()
도 마찬가지로 그려볼 수 있음var.test(종속변수~집단변수, 데이터명)
으로 등분산성 검토할 수 있음.t.test()
쓰는데, 독립표본이니까 paired=True
는 빼고 사용함.var.equal
매개변수로 지정해 줌.ex1) '부모와의 관계(parent_rel3) 상/중/하'에 따른 '성적(grade_re)'의 평균 차이 검증
"부모관계가 좋은 학생 성적, 보통인 학생 성적, 나쁜 학생 성적들이 모집단에서 전부 같은가?"
describeBy()
, freq()
, hist()
, boxplot()
으로 확인qqnorm()
+ qqline()
으로 QQ플롯 그려서 정규성 검토할 수 있음.car
패키지의 leveneTest(종속변수~집단변수)
으로 등분산성 검토할 수 있음.oneway.test()
+ var.equal
매개변수aov
객체 활용 (※이건 등분산성 충족하는 경우에만 사용 가능!!)summary()
로 출력해서 확인 가능함.TukeyHSD()
➡️ "세 집단 모두 유의한 차이가 있다"ScheffeTest()
➡️ "세 집단 모두 유의한 차이가 있다" (확실히 더 엄격하긴 함)PostHocTest(method='bonferroni')
➡️ "세 집단 모두 유의한 차이가 있다"oneway.test(var.equal = FALSE)
이후에 기각 시, games_howell_test()
사용!stringAsFactors=T
ex1) 부모와의 관계(parent_rel3) 상/중/하'와 '성별(gender)'에 따른 · · · · (독립변수 2개)
'성적(grade_re)' 평균 차이 검증 · · · · · · · · · · · · · · · · · · · · · · · · · · · (종속변수 1개)
describeBy()
, boxplot()
등으로 확인 (이전처럼 하나씩 하면 주변평균)leveneTest(종속변수~집단변수)
로 등분산성 확인.aov
객체 + 두 독립변수의 곱⭐ 활용 (결과는 역시 summary()
로 출력)TukeyHSD()
, ScheffeTest()
, PostHocTest(method='bonferroni')
등interaction.plot()
을 사용하면 평균도표(상호작용도표)를 그려볼 수 있음!na.omit()
으로 결측치 지워주고 그려야 함*출처 : 서울대학교 Kmooc, <교육연구와 통계방법>.