이변량분석-범주vs숫자

김범주·2024년 9월 18일
0

AIVLE

목록 보기
10/21
post-thumbnail
#t-test
데이터에 NAN값이 있으면 안됨, 미리 처리
t 통계량
	두 평균의 차이를 표준오차로 나눈 값
    절대값이 2보다 크면 유의미한 차이
spst.ttest_ind(집계된데이터, 집계된데이터)
아래의 데이터는 t통계량의 절대값이 2보다 크고 pvalue가 0.05보다 작으므로 유의미한 차이가 있다고 볼 수 있음
#anova(분산분석)
f 통계량 : (집단 간 분산)/(집단 내 분산) = (전체 평균 − 각 집단 평균)/(각 집단의 평균 − 개별 값)
2~3 이상이면 차이가 있다고 볼 수 있음
아래의 결과는 f통계량이 매우 크고 pvalue도 0.05미만으로 유의미한 차이를 갖는다고 볼 수 있음
profile
개발꿈나무

0개의 댓글