이 포스트는 Hoff, First Course in Bayesian Statistics (2009) 및 학부 통계전산 강의안을 참고하여 정리한 것임을 밝힙니다.
베이지안 통계학을 접하다 보면 빠지지 않는 내용이 MCMC, Gibbs sampling 등 다양한 sampling 방법에 관한 것이다. 기본적으로 통계학의 목적은 모집단으로부터 추출한 샘플을 통해 모집단의 특성을 유추하는 것이므로, 통계학에서 샘플링 방법론은 당연히 중요할 수 밖에 없다. 그런데 유독 베이지안 통계학에서 위와 같은 샘플링 방법들이 자주 등장하는 이유는 무엇일까?
지난 포스트에서 베이지안들의 궁극적인 목적이 posterior distribution임을 살펴본 바 있다. FCB 5장을 보면 normal model에서 mean 과 variance에 대해 joint (posterior) distribution을 구하는 내용이 나온다. 헌데 conjugate prior를 사용해준다 치더라도, 와 의 joint distribution은 우리가(학부생 따위가) 알고 있는 분포도 아니고, 단순히 pdf 만 가지고는 감을 잡기가 어렵다. 이런 경우 와 의 샘플들을 마구마구 생성한 다음, 이 친구들의 plot을 그려보면 어느정도 분포에 관해 유추해볼 수 있을 것이다. 실제 posterior distribution은 마음처럼 예쁘게 나와주지 않는 경우가 대부분이므로, sampling을 통한 분포 유추는 베이지안들에게 꼭 필요하다고 볼 수 있다.
그럼 이제 깁스 샘플링이 무엇인지 알아보자. 깁스 샘플링의 유용성은 아래와 같다.
Useful when sampling from the joint denstiy is difficult, but the full conditionals are available and sampling from them is easy
즉, 구하고자 하는 것이 joint distribution인데 이것이 어려울 때, full conditional distribution을 활용하여 우회하여 구하자는 것이다.
예를 들어, , 라는 두 모수의 joint posterior distribution을 구하고 싶다고 하자.
이므로,
와 라는 full conditional distribution으로부터 라는 joint density를 따르는 를 샘플링할 수 있다. ( joint density를 각각 , 의 함수로 보면 , 는 상수로 취급하여 무시할 수 있다. )
따라서 깁스 샘플링의 과정은 다음과 같다.
Step1. Initialize ,
Step2. Sample from
Step3. Sample from
and so on
이렇게 얻은 sampling distribution은 샘플 수가 많아지면 target distribution에 수렴한다.
참고) sampling distribution은 sample의 분포가 아니라 statistic의 분포이다. (A sampling distribution is a probability distribution of a statistic obtained from a larger number of samples drawn from a specific population.)
이렇게 샘플을 생성했다면, 분포를 plotting 하는 것 외에도 다양한 추정을 할 수 있다. 예를 들어 평균에 대해 알고 싶다면 표본평균을 통해 추정할 수 있고, 분산을 알고싶다면 표본분산을 통해 추정할 수 있다.
그런데 그렇게 추정한 estimate가 괜찮은(?) 값인지는 어떻게 결정할 수 있을까? 하나의 기준이 될 수 있는 것이 바로 표준오차이다. 표준오차는 통계량의 분산을 가리키는 개념이다. 우리가 뽑은 샘플은 수많은 가능한 샘플의 경우의 수 중 하나이므로, 샘플을 어떻게 뽑느냐에 따라 추정치는 달라질 것이다. 만약 샘플을 어떻게 뽑든 이 추정치가 크게 달라지지 않는다면, 그 추정치는 나쁘지 않은 추정치라고 볼 수 있을 것이다.
더 자세한 설명과 예시 문제는 다음에...
깁스샘플링은 Metropolis-Hastings 알고리즘의 speical case로 볼 수 있다.
따라서 acceptance rate = 1 이므로 생성된 샘플을 reject할 필요가 없는 경우이다.