검정력 (Power of Tests)
모수 $ \theta $ 를 포함하는 가설검정에 대해 $W $ 가 검정통계량이고, $RR $ 이 기각역이라면 검정력 $ \text{power}(\theta) $ 는 실제 모수값이 $ \theta $ 일 때 검정이 올바르게 $ H_0 $ 를 기각하게 할 확률이다. 즉 다음과 같다.
$$ \text{power} (\theta) = P(W \in RR \mid \theta) $$
만약 귀무가설이 $ H_0 : \theta = \theta_0 $ 이고, 대립가설이 $H_a: \theta = \theta_a $ $(\theta_0 \neq \theta_a) $ 일 때를 가정하자. 잘 사용하지는 않지만, $ H_0 $ 가 참인데 $ H_0 $ 를 기각할 확률을 $ \text{power}(\theta_0) = P(H_0 : \text{reject} \mid \theta = \theta_0) = \alpha $ 라 검정력을 이용하여 표현할 수 있을 것이고, $ H_0 $ 가 거짓일 때 $ H_0 $ 를 기각할 확률은 $ \text{power}(H_a) = P(H_0:\text{reject} \mid \theta = \theta_a) = 1 - \beta $ 라고 검정력을 활용하여 표현할 수 있을 것이다. 일반적으로 검정력은 대립가설 $ \theta_a $ 에 대해서 사용된다. 단 주의할 점은 $ \theta_a $ 는 특정 값이어야 한다는 것이다.
위 예시를 통해 알 수 있지만, 검정력이 높다는 것은 $ 1-\beta $ 가 크다는 것이고, 즉 $ \beta $ 가 작다는 것이다. 따라서 검정력이 낮다면 $H_0$ 를 기각해야 하는데도 기각하지 않는 것이고, 검정력이 높다면 작고, 주요하지 않은 효과까지 유의하게 보임으로써 $ H_0 $ 를 자주 기각하는 것이다.
이상적인 검정력 곡선(power curve)은 아래와 같다. 즉 $ H_0 : \theta = \theta_0 $ 로부터 이탈을 확실하게 탐지하는 것이다.
그러나 이는 고정된 표본에서 $ \alpha $, $ \beta $ 를 임의로 작게 만들 수 없기 때문에 불가능하다. 따라서 현실적으로는 아래와 같은 검정력 곡선이 나오게 된다.
즉 고정된 표본에서 작은 $ \alpha $ 값(주로 $0.05$ 혹은 $0.01$)을 선택하고 $ H_a $ 에 속하는 모든 $ \theta_a $ 에 대해 $ \beta(\theta_a) $ 를 최소화하는 기각역 $ RR $ 를 구하는 방식을 사용한다.
단순가설 및 복합가설 (Simple Hypothesis and Composite Hypothesis)
만약 확률표본이 모수 $ \theta $ 를 갖는 분포에서 표집되었다면, 가설에서 표본이 추출된 모집단 분포가 유일하게 지정(uniquely specify)되면 단순가설이라 한다. 단순가설이 아니라면 모두 복합가설이라 한다.
예를 들어서 $ N(\mu, \sigma^2) $ 로부터의 확률표본을 가정해보자. 만약 $ \sigma^2 = \sigma^2_\theta $ 로 그 분산이 알려졌고, 가설이 $ H : \mu = \mu_h $ 로 가설을 통해 그 분포를 특정하면 단순가설이다. 만약 분산이 알려져 있지 않다면, 가설로 기댓값을 특정하더라도 확률분포가 특정되지 않으므로 복합가설이다. 혹은 분산이 알려져 있더라도 가설을 $ H: \mu > \mu_h $ 와 같이 분포가 특정되지 않도록 설정한다면 복합가설이다.
최강력검정 (Most Powerful Test)
최강력검정은 네이만-피어슨 보조정리에 의해 결정된다. 네이만-피어슨 보조정리는 다음과 같다.
모수가 $ \theta $ 인 분포로부터 추출된 확률표본 $ X_1, X_2, \cdots, X_n $ 을 기반을 단순귀무가설 $ H_0 : \theta = \theta_0 $ 과 그 와 대립되는 단순대립가설 $ H_a : \theta = \theta_a $ 를 검정한다고 가정하자. $L(\theta) $ 가 모수값이 $ \theta $ 일 때 표본의 가능도라면, 주어진 유의수준 $ \alpha $ 에 대하여 $\theta_a $ 에서 검정력을 최대화시키는 기각역 $ RR $ 은 다음 식의 $ k $ 에 의해 결정된다.
$$ \frac{L(\theta_0)}{L(\theta_a)} < k $$
$ k $ 값은 검정이 $ \alpha $ 에 대해 바람직한 값을 가지도록 선택된다. 이러한 검정은 $ H_0 $ 대 $ H_a $ 검정에 대한 유의수준 $ \alpha $ 의 최강력검정이다.
최강력검정은 MP검정, 혹은 최량검정이라고 하기도 한다.
균일최강력검정 (Uniformly Most Powerful Test)
모수 $ \theta $ 하나를 제외하면 분포가 완전히 특정되는 모집단에서 통계적 검정을 실시하는 경우 일반적으로 다음과 같이 가설을 설정하곤 한다.
$$ H_0 : \theta = \theta_0, \qquad H_a : \theta > \theta_0 $$
그런데 이때 $ H_a $ 는 복합가설이고, 따라서 위 네이만-피어슨 정리를 이용한 최강력검정을 사용할 수 없다. 그러나 많은 상황에서 최강력검정의 실제 기각역 $ RR $ 은 $ \theta_a $ 의 특정값이 아니라 $ H_0 $ 에만 의존하고, 따라서 네이만-피어슨 정리에 의해 얻어진 검정이 $ \theta > \theta_0 $ 인 모든 $\theta $ 에 대해 검정력을 최대화할 때, 이것을 $ H_0 : \theta = \theta_0 $ 대 $ H_a : \theta > \theta_0 $ 에 대한 균일최강력검정이라 한다.
정리하여 일반화하면 $ H_0 : \theta = \theta_0 $ 대 $ H_a : \theta \in \Theta_a $ $ (\theta_0 \notin \Theta_a) $ 에 대해 검정 $ \phi $ 가 크기 $\alpha $ 의 균일최강력검정이 되기 위한 필요충분조건은 $ \phi $ 가 임의의 $ \theta_a \in \Theta_a $ 에 대해 단순가설 대 단순가설인 $ H_0 : \theta = \theta_0 $ 대 $ H_a^\prime : \theta = \theta_a $ 에 대한 최강력검정이 되는 경우이다.
이를 활용하면 $ H_0 : \theta \leq \theta_0 $ 대 $ H_a : \theta > \theta_0 $ 와 같이 복합가설 대 복합가설인 상황에서도 동일하게 최강력검정을 구할 수 있다. 위 복합가설 대 복합가설을 $ H_0 : \theta = \theta_0 $ 대 $ H_a : \theta > \theta_0 $ 로 바꿔서 균일최강력검정을 시행하면 되기 때문이다.
단 특별히 예외적인 경우가 아니라면, 즉 대부분 경우에서 양측검정을 위한 균일최강력검정은 없으니 주의해야 하고, $H_0 : \theta = \theta_0 $ 처럼 생김새가 단순가설인 것 같아도, $ \theta $ 외 미지의 모수가 있어 복합가설이 되는 경우 이를 사용할 수 없다.
균일최강력검정은 UMP 검정이라고도 한다.
'Statistics > Inferential Statistics' 카테고리의 다른 글
[Inferential Statistics] 가능도비 검정(likelihood ratio tests) (0) | 2025.02.24 |
---|---|
[Inferential Statistics] 분산 및 등분산에 대한 검정 (0) | 2025.02.22 |
[Inferential Statistics] 모평균 및 모평균의 차에 대한 소표본 검정 및 강건성(robustness) (0) | 2025.02.21 |
[Inferential Statistics] p-값(p-value) (0) | 2025.02.21 |
[Inferential Statistics] 대표본 검정과 2종 오류 확률 및 표본 크기 결정 (0) | 2025.02.20 |