카이제곱분포 (Chi-Square Distribution)
카이제곱분포는 감마분포의 특수한 형태이면서 $ k $ 개의 서로 독립적인 표준정규분포를 따르는 확률변수를 제곱한 다음 합하여 얻어지는 확률변수의 분포이다. 즉 $ X_i \sim N(\mu, \sigma^2) $ $ (i = 1, 2, \dots, n) $ 에 대하여 $ Z_i = (X_i - \mu) / \sigma $ 일 때 $ Z_i^2 $ 의 합, $ \sum_{i=1}^n Z_i^2 $ 은 자유도가 $ n $ 인 카이제곱분포를 따른다.
$$ \sum_{i=1}^n Z_i^2 \sim \chi^2 (n) $$
참고로 표본을 추출하여 만들어지는 표본분산 $ S^2 $ 을 이용한 $ (n-1)S^2 / \sigma^2 $ 은 자유도가 $ n-1 $ 인 카이제곱분포를 따른다.
$$ \dfrac{(n-1)S^2}{\sigma^2} \sim \chi^2 (n-1) $$
여기서 자유도는 간단하게 말하면 선택 가능한 독립변수의 수이다. 자유도가 커지면 카이제곱분포의 그래프는 정규분포처럼 좌우대칭에 가까워진다.
참고로 카이제곱분포의 $ \operatorname{support} $ 는 $ x \in [ 0, +\infty ) $ 이다.
카이제곱분포의 성질
$ X \sim \chi^2 (k) $ 일 때 다음이 성립한다.
- 확률밀도함수 (PDF)
$$ f_X(x) = \dfrac{x^{k/2-1}e^{-x/2}}{2^{k/2} \Gamma(k/2)} \qquad 0 < x < \infty $$
- 누적분포함수 (CDF)
$$ F_X(x) = \dfrac{\gamma(k/2, x/2)}{\Gamma(k/2)} $$
- 기댓값
$$ E(X) = k $$
- 표준편차
$$ \sigma_X = \sqrt{2k} $$
- 적률생성함수 (MGF)
$$ M_X(t) = (1-2t)^{-k/2} \qquad t < \frac{1}{2}$$
'Statistics > Mathematical Statistics' 카테고리의 다른 글
[Mathematical Statistics] F-분포(F-distribution) (0) | 2025.02.01 |
---|---|
[Mathematical Statistics] t-분포(Student's t-distribution) (0) | 2025.01.31 |
[Mathematical Statistics] 표본평균과 표본분산의 표집분포 (0) | 2025.01.25 |
[Mathematical Statistics] 표집분포(sampling distribution) (0) | 2025.01.23 |
[Mathematical Statistics] 마할라노비스 거리(Mahalanobis distance) (0) | 2025.01.23 |