효율성 (Efficiency)
추정량은 당연하게도 모수를 잘 예측하는가가 중요하다. 따라서 추정량은 불편성, 효율성 등의 특징을 통해 모수를 얼마나 잘 예측하는가를 따져야 한다.
불편성은 편향에 대한 것인데, 만약 불편성을 만족하는 두 추정량, 즉 두 불편추정량이 있다면, 어느 추정량을 선택해야 하는가하는 문제가 생길 것이다. 이때 따져봐야 하는 것이 효율성이다.
효율성은 추정량의 분산에 관한 것으로 분산이 작을수록 효율적이라 한다.
상대효율 (Relative Efficiency)
목표 모수 $ \theta $ 에 대한 두 불편추정량 $ \hat{\theta}_1 $ 과 $ \hat{\theta}_2 $, 그리고 각각의 분산 $ V(\hat{\theta}_1) $ 및 $ V(\hat{\theta}_2) $ 가 주어질 때, $ \hat{\theta}_2 $ 에 대한 $ \hat{\theta}_1 $ 의 상대효율 $ \operatorname{eff}(\hat{\theta}_1, \hat{\theta}_2) $ 는 다음 비율로 정의된다.
$$ \operatorname{eff}(\hat{\theta}_1, \hat{\theta}_2) = \dfrac{V(\hat{\theta}_2)}{V(\hat{\theta}_1)} $$
당연히도 $ \operatorname{eff}(\hat{\theta}_1, \hat{\theta}_2) > 1 $ 이면 $ \hat{\theta}_1 $ 의 분산이 작은 것이기에 $ \hat{\theta}_1 $ 이 선호되고 $ \operatorname{eff}(\hat{\theta}_1, \hat{\theta}_2) < 1 $ 이면 반대로 $ \hat{\theta}_2 $ 가 선호된다.
대표본에서 모평균에 대한 추정값으로 표본중앙값이 아니라 표본평균을 사용하는 이유 역시 상대효율을 통해 확인할 수 있다. 표본중앙값과 표본평균 모두 대표본에서 불편추정량이지만, 상대효율을 따져보면 표본중앙값의 분산이 $ (1.2533)^2(\sigma^2/n) $ 이고, 표본평균의 분산이 $ \sigma^2/n $ 이므로, 표본평균에 대한 표본중앙값의 상대효율은 $ 1 / (1.2533)^2 = 0.6366... $ 이므로 표본평균을 사용한다.
'Statistics > Inferential Statistics' 카테고리의 다른 글
[Inferential Statistics] 점추정량의 충분성(sufficiency) (0) | 2025.02.12 |
---|---|
[Inferential Statistics] 점추정량의 일치성(consistency) (0) | 2025.02.12 |
[Inferential Statistics] 대표본, 소표본에서의 신뢰구간 설정 및 모분산의 신뢰구간 (0) | 2025.02.05 |
[Inferential Statistics] 신뢰구간(CI, confidence interval) (0) | 2025.02.04 |
[Inferential Statistics] 추정오차(error of estimation) (0) | 2025.02.04 |