
2003년 중2 학생을 대상으로 고등학교 졸업 후까지 6년간 매년 추적조사한, 한국청소년패널조사의 데이터로 R프로그램 실습을 진행한 내용이다.

ex1) 1차년도와 2차년도의 '수업참여도(class_parti)' 변수에 대한 두 종속표본 t검증
describe(), hist(), boxplot() 로 확인

clas_parti_d)로 치환해서도 확인

t.test() + paired=True로 종속표본 t검증 할 수 있음
paired=True 옵션 쓰면 안 됨!!)
stringAsFactors=T : 문자열로 입력된 변수(ex. 성별, 학교지역 등)는 범주형으로 설정!
ex1) '성별(gender)'에 따른 '성적(grade_re)'의 평균 차이 검증
"남학생 성적과 여학생 성적이 모집단에서 같은가?"
describeBy(A,B)로 집단별 기술통계 확인 가능 ("A를, B에 따라 describe해줘")
hist(), boxplot()도 마찬가지로 그려볼 수 있음
var.test(종속변수~집단변수, 데이터명) 으로 등분산성 검토할 수 있음.
t.test() 쓰는데, 독립표본이니까 paired=True는 빼고 사용함.var.equal 매개변수로 지정해 줌.

ex1) '부모와의 관계(parent_rel3) 상/중/하'에 따른 '성적(grade_re)'의 평균 차이 검증
"부모관계가 좋은 학생 성적, 보통인 학생 성적, 나쁜 학생 성적들이 모집단에서 전부 같은가?"
describeBy(), freq(), hist(), boxplot() 으로 확인

qqnorm() + qqline()으로 QQ플롯 그려서 정규성 검토할 수 있음.
car 패키지의 leveneTest(종속변수~집단변수) 으로 등분산성 검토할 수 있음.
oneway.test() + var.equal 매개변수
aov 객체 활용 (※이건 등분산성 충족하는 경우에만 사용 가능!!)summary()로 출력해서 확인 가능함.
TukeyHSD() ➡️ "세 집단 모두 유의한 차이가 있다"
ScheffeTest() ➡️ "세 집단 모두 유의한 차이가 있다" (확실히 더 엄격하긴 함)
PostHocTest(method='bonferroni') ➡️ "세 집단 모두 유의한 차이가 있다"
oneway.test(var.equal = FALSE) 이후에 기각 시, games_howell_test() 사용!
stringAsFactors=T
ex1) 부모와의 관계(parent_rel3) 상/중/하'와 '성별(gender)'에 따른 · · · · (독립변수 2개)
'성적(grade_re)' 평균 차이 검증 · · · · · · · · · · · · · · · · · · · · · · · · · · · (종속변수 1개)
describeBy(), boxplot() 등으로 확인 (이전처럼 하나씩 하면 주변평균)



leveneTest(종속변수~집단변수)로 등분산성 확인.
aov 객체 + 두 독립변수의 곱⭐ 활용 (결과는 역시 summary()로 출력)
TukeyHSD(), ScheffeTest(), PostHocTest(method='bonferroni') 등

interaction.plot()을 사용하면 평균도표(상호작용도표)를 그려볼 수 있음!na.omit()으로 결측치 지워주고 그려야 함
➡️ "여학생이 남학생보다, 성적에 있어서 부모와의 관계 영향을 많이 받는다!"*출처 : 서울대학교 Kmooc, <교육연구와 통계방법>.