베이즈 정리와 인과관계 추론
- 데이터가 새로 추가되었을 때 정보를 업데이트하는 방식에 대한 기반이 되므로 머신러닝에 사용되는 예측모형의 방법론으로 많이 사용됨
조건부 확률
P(A∩B)=P(B)P(A∣B)
- P(A∣B) : 사건 B가 일어난 상황에서 사건 A가 발생할 확률
P(B∣A)=P(A)P(A∩B)=P(B)P(A)P(A∣B)
베이즈 정리를 통한 정보의 갱신
- 베이즈 정리를 통해 이전의 사후확률을 사전확률로 사용하여 갱신된 사후확률을 계산할 수 있음
조건부확률 인과관계
- 데이터가 많아져도 조건부 확률로만 인과관계를 추론하는 것은 불가능
- 인과관계는 데이터 분포의 변화에 강건한 예측모형을 만들 때 필요
- 중첩요인(confounding factor)의 효과를 제거하고 원인에 해당하는 변수만의 인과관계를 계산해야 함
(중첩요인을 제거하지 않으면 가짜 연관성(spurious correlation)이 나옴)
예시는 강의자료 다시 참고(베이즈 정리, 정보갱신, 인과관계 추론)
https://m.blog.naver.com/davidj09/221246165061
출처 - 부스트캠프 AI tech 교육자료
[부스트캠프 AI Tech] Week 1 - Day 5