베타분포 (Beta Distribution)

 

확률변수 $ X $ 의 밀도함수가 $ \alpha > 0 $ 와 $ \beta > 0 $ 에 대해 다음과 같다면 확률변수 $ X $ 가 베타분포를 따른다고 한다.

$$ f(x) = \dfrac{x^{\alpha -1}(1-x)^{\beta-1}}{B(\alpha, \beta)} \qquad 0 \leq x \leq 1 $$

Beta Function

베타함수 $ B $ 는 다음과 같이 정의된다.

$ B(\alpha, \beta) = \int_0^1 t^{\alpha-1} (1-t)^{\beta-1} dt  = \dfrac{\Gamma{\alpha}\Gamma{\beta}}{\Gamma{\alpha+\beta}} $

또한 확률변수 $ X $ 가 매개변수 $ \alpha $, $ \beta $ 를 가지는 베타분포를 따를 경우 다음과 같이 나타낸다.

$$ X \sim \text{Beta}(\alpha, \beta) $$

만약 $ \alpha = 1 $ 이고 $ \beta = 1 $ 이라면 즉 $ \text{Beta}(1, 1) $ 이라면 $ U(0, 1) $ 과 같다

베타함수는 $ 0 \leq x \leq 1 $ 이 아니더라도 스케일링을 통해 사용할 수 있다. 예를 들어 $ c \leq x \leq d $ 라면 다음이 성립한다.

$$ 0 \leq x^* = \dfrac{x-c}{d-c} \leq 1 $$

 


베타분포의 성질

 

$ X \sim \text{Beta}(\alpha, \beta) $ 일 때 다음이 성립한다.

  • 확률밀도함수 (PDF)

$$ f_X(x) = \dfrac{x^{\alpha -1}(1-x)^{\beta-1}}{B(\alpha, \beta)} \qquad 0 \leq x \leq 1 $$

  • 누적분포함수 (CDF)

$$ I_X(\alpha, \beta) = \int_0^x \dfrac{t^{\alpha-1} (1-t)^{\beta-1}}{B(\alpha, \beta)} dt $$

참고로 이를 정규화된 불완전 베타함수(regularized incomplete beta function)라 한다.

Incomplete Beta Function

다음을 불완전 베타함수(incomplete beta function)라 한다.

$ B(x; \alpha, \beta) =  \int_0^x t^{\alpha-1} (1-t)^{\beta-1} dt $

즉 $ I_X(\alpha, \beta) = \dfrac{B(x; \alpha, \beta)}{B(\alpha, \beta)} $ 이다.

만약 $ x = 1 $ 이면 완전 베타함수이다.

  • 기댓값

$$ E(X) = \dfrac{\alpha}{\alpha + \beta} $$

  • 표준편차

$$ \sigma_X = \sqrt{ \dfrac{\alpha \beta}{(\alpha+\beta)(\alpha + \beta + 1)}} $$

 


이항분포와의 관계

 

만약 $ X \sim \text{Beta}(\alpha, \beta) $ 일 때 $ \alpha $ 와 $ \beta $ 가 모두 양의 정수라면 $ 0 \leq x \leq 1 $ 에 대해 다음이 성립한다.

$$ F(x) = I_X(\alpha, \beta) = \sum_{i=a}^n \binom{n}{i} x^i (1-x)^{n-i} $$

이때 $ n = \alpha + \beta - 1 $ 이고, $ F(x) \sim B(n, x) $ 이다.

또한 베타함수 $ B $ 를 이항계수의 일반화로 생각할 수 있다. 즉 다음과 같다.

$$ \binom{n}{k} = \dfrac{1}{(n+1)B(n-k+1, k+1)} $$

 

애스터로이드