사후 확률을 갱신하는 과정이 기계학습과 비슷한 원리로 이루어진다는 점에서 학부생때는 접근하지 못했던 방법에 대해 다시 한 번 더 정리하고 공부하게 되었다.
ex) covid-99라는 질병 탐지 기술
covid-99의 발병률이 10%정도로 알려져 있고, 실제 질병에 걸렸을 때 검진될 확률은 99%, 걸리지 않았을 때 오검진될 확률은 1%라고 한다. 이 때, 어떤 사람이 질병에 걸렸다고 검진결과가 나왔을 때 정말로 covid-99에 감염되었을 확률은?
P(θ)=0.1P(D∣θ)=0.99P(D∣¬θ)=0.01P(D)=θ∑P(D∣θ)P(θ)=0.99×0.1+0.01×0.9=0.108P(θ∣D)=P(θ)P(D)P(D∣θ)=0.1×0.1080.99≈0.916
만약, 오검진률이 10%로 올라간다면?
P(θ)=0.1P(D∣θ)=0.99P(D∣¬θ)=0.1P(D)=θ∑P(D∣θ)P(θ)=0.99×0.1+0.1×0.9=0.189P(θ∣D)=P(θ)P(D)P(D∣θ)=0.1×0.1890.99≈0.524
- 사후 확률의 갱신

앞서 covid-99 판정을 반은 사람이 두 번째 검진을 받았을 때도 양성이 나왔을 때, 진짜 covid-99에 걸렸을 확률은? (52.4% 밖에 안되는 정밀도이니, 당연히 두번째에도 믿을 수 없을만한 수치가 나올까?)
P(θ′)=0.524P(D∣θ)=0.99P(D∣¬θ)=0.1P(D′)=θ∑P(D∣θ)P(θ)=0.99×0.524+0.1×0.476=0.566P(θ∣D)=P(θ)P(D)P(D∣θ)=0.524×0.5660.99≈0.917
91.7%라는 굉장히 높은 정밀도가 나오게 된다. (참고로 세번째 검사까지도 양성이 나온다면, 정밀도는 99.1%까지 갱신된다)