베르누이 시행과 이항분포

매일 공부(ML)·2022년 2월 22일
0

베르누이 시행

시행이라고 하는 것은 통계적 실험을 하는 것입니다.

결과를 알 수 없는 시행의 결과가 반드시 두 가지 중에 하나로 나타나야 됩니다.

이 두 가지를 하나는 성공, 하나는 실패로 표현을 많이 합니다.
그래서 성공이냐 실패 둘 중 하나의 결과로 나타나야 합니다.

그 다음 매번 시행에서 성공할 확률을 p=p(S)로 나타낼 때 p는 매번 시행마다 동일해야 합니다.
첫 번째 시행할 때는 p가 1/2인데 두 번째 할 때는 1/3이라면 이것은 베르누이 시행이 아닙니다.

그 다음으로 매번 시행이 서로 독립이 되어야 합니다.
전 시행의 결과가 그 다음 시행 결과에 영향을 미치면 이것은 베르누이 시행이 아닙니다.

매 시행은 독립이여야 한다는 이 3가지 조건을 반드시 만족하는 시행이 베르누이 시행이라고 합니다.
그렇다면 이항분포는 어떻게 정의 되는지 알아보겠습니다.


이항분포

베르누이 시행을 n번 한다고 합시다.
n번 시행을 해서 그 중에서 성공의 횟수를 x번이라고 했을 때 성공의 횟수를 나타내는 확률변수를 X라고 놓겠습니다.

이 X가 취할 수 있는 것은 n번 시행에서 성공이 한 번도 일어나지 않을 수 있고 1번 일어날 수도 있고 모두 일어 날 수도 있습니다.
그래서 이 확률변수 x가 취할 수 있는 값의 범위는 0에서 n까지의 정수값이고 X는 이산 확률 변수가 되겠습니다.

다음으로 매번 시행에서 성공의 확률을 p라고 하겠습니다.
그러면 이산 확률변수 X가 이항분포를 따른다면 이때 확률밀도함수는 이렇게 표현이 됩니다.

먼저 여기에 있는 이 기호는 n choose x라고 읽고 n개중에서 x개를 뽑는 총 가짓수로 n!/x!(n-x)!으로 정의 됩니다.

그 다음에 성공의 확률에 x승, 실패의 확률에 n-x승을 곱해준 것이 확률 밀도함수가 됩니다.
앞으로 우리는 X~B(n,p) 표현을 많이 사용할 것입니다.

여기서 ~기호는 ‘~로 분포되어 있다’를 의미합니다.
B(n,p)에서 B는 binomial의 첫 글자 b를 따온 것입니다.
n은 총 시행횟수이고 두 번째 오는 p는 성공의 확률입니다.

이렇게 X~B(n,p)는 ‘X는 n,p인 이항분포를 따른다.’ 이렇게 읽습니다.

그 다음에 여러분들이 앞에서 배운 기댓값의 정의를 이용하면 이항분포의 모평균은 시행횟수*성공의 확률 np로 나타나고 모분산은 np에 실패의 확률을 곱해 np(1-p)로 나타납니다.

profile
성장을 도울 아카이빙 블로그

0개의 댓글