A/B Test에서의 z-test, Chi-squared test

Seohyeon Park·2025년 5월 19일
0

Intro.

A/B 테스트에 데이터가 범주형 이항 데이터(성공/실패)를 분석하는 경우라면, 대표적인 통계 검정 기법 중 Z-test for proportions와 Chi-squared test를 고려해볼 수 있다.

실무에서는 자주 혼용되거나 대체적으로 동일한 결과를 도출한다. 그러나 이들은 적용 전제, 해석 방식, 결과 활용 측면에서 미묘한 차이를 가지므로 올바른 맥락에서 선택할 필요가 있다.

Example.

마케팅 이메일 A, B를 각각 1,000명에게 발송하고 관측한 결과(범주형 이항 데이터)가 다음과 같다고 가정한다.

  • 귀무가설(H0H_0) : A와 B의 클릭률은 차이를 가지지 않는다.
  • 대립가설(H1H_1) : A와 B의 클릭률은 차이를 가진다.
그룹클릭 (Yes)비 클릭 (No)전체
A100700800
B1568841040
전체25615841840

1. z-test의 계산

Z=p1p2p(1p)(1n1+1n2),p1=x1n1,p2=x1n1,p=x1+x2n1+n2Z=\frac{p_1-p_2}{\sqrt{p(1-p)(\frac{1}{n_1}+\frac{1}{n_2})}},\\ p_1=\frac{x_1}{n_1},\quad p_2=\frac{x_1}{n_1},\quad p=\frac{x_1+x_2}{n_1+n_2}
  • p1=80800=0.10p_1 = \frac{80}{800}=0.10
  • p2=1561040=0.15p_2 = \frac{156}{1040}=0.15
  • p=80+156800+10400.1283p = \frac{80+156}{800+1040}\approx0.1283
Z=0.100.150.1283×(10.1283)(1800+11040)=0.050.01572Z = \frac{0.10-0.15}{\sqrt{0.1283\times(1-0.1283)(\frac{1}{800}+\frac{1}{1040})}}=\frac{-0.05}{0.01572}
Z3.18Z\approx-3.18

양측 검정일 경우, pp - valuevalue의 경우 p2×0.00073=0.00146p\approx2\times0.00073 = 0.00146 이므로, 귀무가설(H0H_0)을 기각한다.

2. Chi-squared test의 계산

χ2=i=1rj=1c(OijEij)2Eij,Eij=(rowi  total  ×  colj  total)grand  total\chi^2=\sum^r_{i=1}\sum^c_{j=1}\frac{(O_{ij}-E_{ij})^2}{E_{ij}},\quad E_{ij} = \frac{(row_i\;total \;\times \;col_j\;total)}{grand\;total}
  • A그룹
    • EA,클릭=800×2361040102.61E_{A,클릭} = \frac{800\times236}{1040} \approx 102.61
    • EA,비클릭=1000102.61=697.39E_{A,비클릭} = 1000-102.61 = 697.39
  • B그룹
    • EB,클릭=1040×2361840133.39E_{B,클릭} = \frac{1040\times236}{1840} \approx 133.39
    • EB,비클릭=1040133.39=906.61E_{B,비클릭} = 1040 - 133.39 = 906.61
  • 각 셀별 계산
    • A 클릭 : (80102.61)2102.61512.4102.614.995\frac{(80-102.61)^2}{102.61}\approx\frac{512.4}{102.61}\approx4.995
    • A 비클릭 : (720697.39)2697.39512.4697.390.735\frac{(720-697.39)^2}{697.39}\approx\frac{512.4}{697.39}\approx0.735
    • B 클릭 : (156133.39)2133.394.995\frac{(156-133.39)^2}{133.39}\approx4.995
    • B 비클릭 : (884906.61)2906.610.735\frac{(884-906.61)^2}{906.61}\approx0.735
χ2=4.995+0.735+4.995+0.735=11.46\chi^2 = 4.995 + 0.735 +4.995 + 0.735 = 11.46

양측 검정일 경우, pp - valuevalue의 경우 p0.0007p\approx 0.0007 이므로, 귀무가설(H0H_0)을 기각한다.

End.

A/B 테스트에서 클릭률이나 전환률과 같이 이항형 결과(성공/실패)를 비교할 때, Z-test for proportionsChi-squared test for independence는 모두 유효한 통계 검정 방법이다. 수학적으로도 매우 유사하여 많은 경우에서도 동일한 결과를 보여준다.

실무에서는 결과가 직관적이고 신뢰구간과 효과 크기까지 쉽게 해석이 가능한 z-test가 더 자주 사용된다.

profile
카페에서 한줄 한줄

0개의 댓글