다항분포 (Multinomial Distribution)
- 다항실험 (Multinomial Experiment)
이항실험의 일반화로 다음과 같은 성질을 가진다. 실험은 $ n $ 번의 동일한 시행으로 이뤄지며, 각 시행의 기본결과는 $k $ 개의 부류 중 하나에 속한다.
단일 시행의 기본결과가 $ i $ 번째 부류에 속할 확률을 $ p_i $ $(i = 1, 2, \cdots, k) $ 라 하면 $ \sum_{i=1}^k p_i = 1 $ 이고, 이 확률은 시행마다 동일하게 유지된다. 또한 시행들을 i.i.d.를 따른다.
이때 관심있는 확률변수는 $ X_1, X_2, \cdots, X_k $ 로 $ X_i $ 는 기본결과가 $ i $ 번째 부류에 속하는 시행의 횟수이며 $ \sum_{i=1}^k X_i = n $ 이다.
- 다항분포
여러 개의 값을 가질 수 있는 독립 확률변수들에 대한 확률분포로 이항분포는 두 개의 값을 가질 수 있는 독립 확률변수들에 대한 확률분포이다.
$ \mathbf{X} \sim \operatorname{Mult}_k(n, \mathbf{p} ) $
$ ( \mathbf{X} = \begin{bmatrix} X_1 & X_2 & \cdots & X_k \end{bmatrix} $, $\mathbf{p} = \begin{bmatrix} p_1 & p_2 & \cdots & p_k \end{bmatrix} ) $
좀더 자세히는 $ i $ 번째 부류에 속할 확률인 $ p_1, p_2, \cdots, p_k $ 가 존재하고 $ \sum_{i=1}^k p_i =1 $ 이며 $ p_i > 0 $ 일 때 각 $ i $ 번째 부류에 속하는 시행 횟수인 $ X_1, X_2 , \cdots, X_k $ 의 결합확률함수가 다음과 같으면 $ X_1, X_2, \cdots, X_k $ 는 모수 $ n $ 과 $ p_1, p_2, \cdots, p_k $ 를 가지는 다항분포를 따른다고 한다.
$ X_i $ 의 결합확률함수는 $ p(x_1, x_2, \cdots, x_k) = \frac{n!}{x_1! x_2! \cdots x_k!} p_1^{x_1} p_2^{x_2} \cdots p_k^{x_k} $ 이다. 이때 앞서 말한바와 같이, 그리고 당연히 $ \sum_{i=1}^k x_i = n $ 이다.
다항분포의 성질
$ \mathbf{X} \sim \operatorname{Mult}_k(n, \mathbf{p} ) $ 일 때 다음이 성립한다.
- 확률질량함수 (PMF)
$$ p_X(x_1, x_2, \cdots, x_k) = \frac{n!}{x_1! x_2! \cdots x_k!} p_1^{x_1} p_2^{x_2} \cdots p_k^{x_k} $$
- 기댓값
$$ E(X_i) = np_i $$
- 표준편차
$$ \sigma_X(X_i) = \sqrt{n p_i (1-p_i)} $$
- 공분산
$$ \operatorname{Cov} (X_i, X_j) = - n p_i p_j , \quad (i \neq j) $$
- 적률생성함수 (MGF)
$$ M_\mathbf{X}(t) = \left[ \sum_{i=1}^k p_i e^{t_i} \right] ^ n $$
다항주변확률분포
다항확률분포의 주변확률분포는 이항분포이다. 즉, $ \mathbf{X} \sim \operatorname{Mult}_k (n, \mathbf{p}) $ 이면 $ X_i \sim B(n, p_i) $ 이다.
다항 간략화 (Multinomial Lumping)
만약 $ \mathbf{X} \sim \operatorname{Mult}_k (n, \mathbf{p}) $ 일 때 서로 다른 $ i $ 와 $ j $ 에 대해 $ X_i + X_j \sim B(n, p_i + p_j) $ 이다. 또한 클래스 $ i $ 와 $ j $ 를 병합하여 얻어진 새로운 클래스 수의 확률벡터는 여전히 다항분포 형태를 유지한다. 즉 다항분포의 확률벡터 내 여러 클래스를 병합하면 또다른 다항분포의 확률벡터가 된다.
예를 들어 $ \mathbf{X} \sim \operatorname{Mult}_5 (n, \mathbf{p}) $ 가 있을 때 $ \mathbf{Y} = \begin{bmatrix} X_1 & X_2 & X_3 + X_4 + X_5 \end{bmatrix} $ 라면 $ \mathbf{Y} \sim \operatorname{Mult}_3 (n, \begin{bmatrix} p_1 & p_2 & p_3 + p_4 + p_5 \end{bmatrix} ) $ 이다.