Chapter 02. Random Variables (확률 변수)

Mono Haru·2023년 5월 9일
0

Probability Statistics

목록 보기
3/5

2.2 Definition of RV (확률변수의 정의)


  • EventEvent에 대한 특정한 outcomeoutcomereal numberreal\ number에 대응시킨다.

RV notation


  • X(wi)=xiX(w_i) = x_i
    • wiw_i에 대한 RV을 xix_i로 사용한다.
  • RV은 영대문자를 사용한다.
    • ex) X, Y, Z,X,\ Y,\ Z, \cdots
  • RV의 특정한 값은 소문자를 사용한다.
    • ex) x1, x2, x3,x_1,\ x_2,\ x_3,\cdots

2.3 Event Defined by RV


  • Let AxAx be an event, Ax={wX(w)=x}Ax = \{w|X(w)=x\}

2.4 Distribution Functions


  • For an RV XX
    • a real value xx

Cumulative Distribution Function (CDF)


  • 한국어로 ‘누적 부수 분포’라고 한다.
  • 특정 범위 안에 전체 확률값을 구할 때 사용한다.

CDF notation


FX(x)=p(Xx)\begin{aligned} F_X(x) = p(X\leq x) \end{aligned}

CDF property


  1. 만약 x1<x2x_1 < x_2라면,

    FX(x1)FX(x2)F_X(x_1)\leq F_X(x_2)

  2. Non-decreasing

    • 감소하지 않는 성질이 있다.
      • 확률을 누적하기 때문이다.
  3. 0FX(x)10\leq F_X(x) \leq 1

    • 항상 0보다 크거나 같고, 1보다 작거나 같다.
  4. FX()=limxFX(x)=1F_X(\infty)=\lim_{x\rightarrow \infty}F_X(x)=1

    • 모든 누적 확률을 총합은 1이다.
  5. FX()=limxFX(x)=0F_X(-\infty)=\lim_{x\rightarrow -\infty}F_X(x)=0

    • -\infty부터 -\infty까지 누적확률은 00이다.
  6. P(a<Xb)=FX(b)FX(a)P(a<X\leq b)=F_X(b)-F_X(a)

    • 특정 구간 안에 누적확률은 구간 끝 점의 CDF의 차와 같다.
  7. P(X>a)=1FX(a)P(X>a)=1-F_X(a)

    • 1 - CDF는 특정 구간을 제외한 모든 곳의 누적확률과 같다.

2.5 Discrete RV (불연속적인 확률 변수)


  • 확률 변수값이 서로 이어져 있지 않다.
  • 주로 정수값을 사용한다.

Probability Mass Function (PMF)


  • 각각의 확률 변수의 확률을 구할 수 있다.

PMF notation


PX(x)=P(X=x)\begin{aligned} P_X(x)=P(X=x) \end{aligned}

CDF of discrete RV


FX(x)=P(Xx)=xixPX(xi)\begin{aligned} F_X(x) &= P(X\leq x) \\ &= \sum_{x_i \leq x}P_X(x_i) \end{aligned}

2.6 Continuous RV (연속 확률 변수)


  • 모든 outcomeoutcomereal valuereal \ value에 mapping한다.
  • outcomeoutcomereal valuereal\ value는 셀 수 없이 많다.
  • 따라서 특정한 실수값 xix_i에 대한 p(X=xi)p(X=x_i)를 구할 수 없다.
  • 그래서 continuous RV에 경우 density를 통해 확률을 구한다.

Probability Density Function (PDF)


limΔx0P(x<Xx+Δx)=FX(x+Δx)FX(x)\begin{aligned} & \lim_{\Delta x \rightarrow0}P(x<X\leq x+\Delta x)=F_X(x+\Delta x) - F_X(x) \end{aligned}
limΔx0P(x<Xx+Δx)Δx=FX(x+Δx)FX(x)Δx\begin{aligned} \lim_{\Delta x \rightarrow0} \dfrac{P(x<X\leq x+\Delta x)}{\Delta x} &= \dfrac{F_X(x+\Delta x)-F_X(x)}{\Delta x} \end{aligned}
  • 이는 00\dfrac{0}{0} 수렴한다.
  • 하지만 분모가 0이 될 수 없으므로 유한한 실수값이 나온다.
PDF=f(x)=limΔx0FX(x+Δx)FX(x)Δx=FX(x)\begin{aligned} PDF&=f(x)\\&=\lim_{\Delta x \rightarrow 0} \dfrac{F_X(x+\Delta x)-F_X(x)}{\Delta x} \\ &= F'_X(x) \end{aligned}
  • 연속 확률 분포의 확률은 단위 길이 당 밀도값으로 계산한다.
  • CDF을 미분한 형태이다.

PDF property


  1. fx(x)0f_x(x) \geq 0

    • Non-negative
      • CDF는 항상 누적되기 때문에 CDF의 미분값인 PDF는 항상 양수이다.
  2.  fx(x) dx=1\int_{-\infty}^{\infty}\ f_x(x)\ dx=1

    • 모든 확률의 합은 1이다
  3. P(a<xb)=abfX(x) dxP(a<x\leq b)=\int_{a}^{b}f_X(x)\ dx

    • 구간 안의 확률은 PDF의 적분을 통해 구한다.
    P(a<xb)=FX(b)FX(a)=bfX(x) dxafX(x) dx=abfX(x) dx\begin{aligned} P(a<x\leq b) &=F_X(b)-F_X(a) \\ &=\int_{-\infty}^{b}f_X(x)\ dx-\int^{a}_{-\infty}f_X(x)\ dx \\ &=\int_a^bf_X(x)\ dx \end{aligned}
  4. P(X<a)=P(Xa)P(X<a)=P(X\leq a)

    • P(X=a)0P(X=a) \rightarrow 0 이기 때문에 둘은 서로 같은 값을 가진다.
profile
Muzic is my life!

0개의 댓글