1. Probability
1.1 Introduction
- 확률은 불확실성을 수량화하는 수학적 언어
- 확률론 기저의 기본 개념들을 소개
- 가능한 결과들의 집합인 sample space로 시작
1.2 Sample Spaces and Events
- Sample space Ω는 실험에서 가능한 결과들의 집합
- Sample space 안의 포인트 ω는 sample outcomes, realizations, elements로 불림
- Sample space의 부분집합들을 Events로 부른다.
- Ai∩Aj,i=j → disjoint or mutually exclusive
- Indicator function

- monotone increasing, monotone decreasing 모두 An→A로 표현
1.3 Probability
- P(A): Probability of A, Probability distribution of A, Probability measure of A
- The three axioms of P

- P(A)에 대한 두 가지 보편적인 해석
-
The frequency interpretation
반복 수행에서 A가 참인 시행 횟수의 비율
ex) 동전의 앞면이 나올 확률이 1/2일 때 동전의 토스 횟수를 늘릴 때 앞면이 나오는 시행 횟수 비율이 1/2로 가는 경향을 보임
무한의 시행 횟수의 동전을 토스한다고 할 때 나오는 비율을 이상적인 상수 값으로 제한함
-
The degree-of-belief interpretation
관찰자가 A가 참이 될 것이라는 믿음의 강도를 측정한 것
- 두 가지 보편적인 해석 모두 세 가지 공리를 만족해야한다.
- Statistical inference를 다루기 전까지는 두 가지 해석 방법에는 차이가 없다.
- 세 가지 axiom으로부터 유도할 수 있는 식

1.6 Lemma


1.8 Theorem (Continuity of Probabilities)
IfAn→A,then P(An)→P(A) as n→∞
An을 monotone increasing이라고 가정
A=limn→∞An=∪i=1∞Ai
B1=A1,B2={ω∈Ω:ω∈A2,ω∈A1}
B3={ω∈Ω:ω∈A3,ω∈A2,ω∈A1}...
- B1,B2,...는 서로 겹치는 요소들이 없기 때문에 disjoint하다.
- An=∪i=1nAi=∪i=1nBi, for each n
- ∪i=1∞Ai=∪i=1∞Bi
- Axiom 3에 의해 (서로 disjoint한 event들의 합집합의 확률은 event들의 확률의 합과 같다)


1.4 Probability on Finite Sample Spaces
- Sample space Ω가 유한한 개수의 요소를 가지는 경우를 가정
- ∣A∣:A가 갖고 있는 요소들의 개수
- Ω가 유한한 개수를 가지고 각 결과들이 나올 가능성이 같다면
- P(A)=∣Ω∣∣A∣ → Uniform probability distribution
- 확률을 계산하기 위해서 event A안의 포인트들의 개수를 세어야한다.
- Point들의 개수를 세는 것을 combinatorial methods라고 부름
- n개의 요소가 주어졌을 때
1.5 Independent Events
- 동전을 두 번 던질 때 앞면이 두번 나오는 확률을 21×21로 계산함 → 두 번의 토스가 독립적인 사건으로 여기기 때문에 확률을 곱함
- 독립의 공식적인 정의

- 독립은 두 가지 별개의 방법으로 발생한다.
- 두 이벤트가 독립이라고 가정함 ex) 동전의 토스의 경우 두 번째 토스에서 첫 번째 토스의 정보를 저장할 메모리가 없음
- P(AB)=P(A)P(B)를 증명해서 독립임을 보임
- 두 가지 disjoint event A,B는 P(AB)가 0이 되기 때문에 독립이 아님
1.6 Conditional Probability

- P(A|B)는 B가 발생하는 횟수 중 A가 발생하는 횟수
- 고정된 B에 대해서 P(B)>0, P(.|B)는 확률이기에 세 개의 공리를 만족
- P(A|B) ≥0, P(Ω∣B)=1
- A1,A2,...가 서로 disjoint할 때


- 조건부 확률의 먼저 주어지는 이벤트가 바뀌면 일반적으로 값이 같지는 않다.
P(A∣B)=P(B∣A)
ex) 홍역이 있을 경우 반점이 생길 확률은 1이지만 반점이 생겼을 때 홍역일 확률은 1이 아님
1.14 Lemma
- A와 B가 독립인 이벤트 일 때 P(A|B)=P(A)
- P(AB)=P(A|B)P(B)=P(B|A)P(A)
- P(AB)=P(A)P(B)=P(A|B)P(B) ⇒ P(A|B)=P(A)
- A와 B가 독립일 때는 이벤트 B는 A의 확률에 영향을 주지 않는다


1.7 Bayes’ Theorem
- Expert system과 Bayes’ nets의 기초
1.16 Theorem (The Law of Total Probability)
- A1,...,Ak로 sample space가 이루어질 때 임의의 이벤트 B에 대해

Cj=BAj,C1,...,Ck가 disjoint라고 가정



- P(Ai): Prior of probability of A
- P(Ai∣B): Posterior probability of A
1.19 Example
P(A1∣B)=P(B)P(A1B)=∑jP(B∣Aj)P(Aj)P(B∣A1)P(A1)=P(B∣A1)P(A1)+P(B∣A2)P(A2)+P(B∣A3)P(A3)P(B∣A1)P(A1)=0.9×0.7+0.2×0.01+0.01×0.10.9×0.7=0.995