보조통계량 (Ancillary Statistic)
통계량의 분포가 모수 $ \theta $ 에 의존하지 않으면 그 통계량을 보조통계량이라 한다.
보조통계량은 단독으로는 $ \theta $ 에 대한 정보를 가지고 있지 않다. 그러나 다른 통계량과 함께 사용되면 때때로 $\theta $ 의 추론을 위한 가치있는 정보를 포함하기도 한다.
바수 정리 (Basu Theorem)
$ X_1, X_2, \cdots, X_n $ 을 $ f (x \mid \theta) $, $ \theta \in \Theta $ 로부터 구한 확률표본이라 하자. 이때 $ Y = u (X_1, X_2, \cdots, X_n) $ 가 $ \theta $ 에 대한 완비충분통계량이고, $ Z = v(X_1, X_2, \cdots, X_n) $ 가 $ \theta $ 에 의존하지 않으면 두 통계량 $ Y $ 와 $ Z $ 는 독립이다.
즉 완비충분통계량과 보조통계량은 독립이다. 예를 들어 정규분포에서 구한 확률표본의 표본평균 $ \bar{X} $ 와 표본분산 $ S^2 $ 이 서로 독립임을 확인할 수 있다.
$ Y $ 가 충분통계량이므로 $ Z \mid Y = y $ 의 분포는 $ \theta $ 에 의존하지 않는다. 또한 $ Z $ 의 분포는 다음과 같아.
$ f_Z(z) = \int f_{Z, Y} (z, y \mid \theta) dy = \int f_{Z \mid Y} (z \mid y) f_Y ( y \mid \theta) dy, \qquad \forall \theta \in \Theta $
따라서 모든 $ \theta $ 에 대해 다음과 같다.
$ 0 = f_Z(z) - \int f_{Z\mid Y} (z \mid y) f_Y(y \mid \theta) dy $
$ = \int f_Z(z) f_Y(y \mid \theta) dy - f_{Z \mid Y} (z \mid y) f_Y ( y \mid \theta) dy $
$ = \inf \left[ f_Z(z) - f_{Z \mid Y}(z \mid y) \right] f_Y (y \mid \theta) dy $
$ = E_\theta [g(Y)] $
여기서 $ g(y) = f_Z(z) - f_{Z \mid Y} (z \mid y) $ 이며 $ g ( \cdot) $ 는 $ \theta $ 와 무관하다. 왜냐하면 $ Z $ 가 보조통계량이고, $Y $ 가 충분통계량이기 때문이다.
이때 $ Y $ 가 충분통계량이므로 모든 $ y $ 에 대하여 $g(y) = 0 $ 이다. 따라서 다음과 같다.
$ f_Z(z) = f_{Z \mid Y} (z \mid y) $
즉 $ Y $ 와 $ Z $ 는 독립이다.
'Statistics > Inferential Statistics' 카테고리의 다른 글
[Inferential Statistics] 최대가능도법(method of maximum likelihood) (0) | 2025.02.14 |
---|---|
[Inferential Statistics] 적률법(method of moments) (0) | 2025.02.14 |
[Inferential Statistics] 레만-셰페 정리(Lehmann–Scheffé theorem) (0) | 2025.02.14 |
[Inferential Statistics] 점추정량의 완비성(completeness) (0) | 2025.02.14 |
[Inferential Statistics] 최소분산 불편추정량(MVUE, minimum variance unbiased estimator) (0) | 2025.02.14 |