하우스만 검정 (Hausman Test)
랜덤효과 모형을 사용하여 회귀계수를 추정하려면 완전 외생성(strict exogeneity), 직교성(orthogonality), 등분산성(homoscedastic)을 만족해야 했고, 이 중 완전 외생성과 등분산성은 고정효과 모형에서도 가능한 성립해야 했다.
그러나 직교성, 즉 시간에 불변하는 $ c_i $ 와 설명변수 $ \mathbf{x}_{it} $ 가 상관되지 않아야 한다는 랜덤효과 모형에서만 가정되었다. 고정효과 모형에서는 이를 허용하는 대신 시간에 불변하는 요인을 모두 $ c_i $ 에 포집하여 처리하였다.
따라서 쉽게 설명하면 고정효과는 가정이 약한 모형이지만, 더 일반적이라 할 수 있고, 랜덤효과 모형은 가정이 강하지만 고정효과 모형보다는 일반적이지 못하다고 할 수 있다.
그렇다면 주어진 상황에서 직교성이 만족하는지를 어떻게 확인하고, 어떤 기준을 통해 고정효과 혹은 랜덤효과 모형을 선택하여 회귀계수를 추정할 수 있을까 생각해볼 수 있다. 이때 사용하는 것이 하우스만 검정이다.
하우스만 검정은 다음과 같은 귀무가설과 대립가설을 통해 검정한다.
$$ H_0 > \hat{\boldsymbol{\beta}}_{RE} - \hat{\boldsymbol{\beta}}_{FE} = 0 \quad \text{vs} \quad H_a : \hat{\boldsymbol{\beta}}_{RE} - \hat{\boldsymbol{\beta}}_{FE} \neq 0 $$
즉 랜덤효과 모형을 이용한 추정치와 고정효과 모형을 이용한 추정치가 거의 같아야 한다는 것이 귀무가설이다. 만약 귀무가설이 성립한다면 랜덤효과 모형을 쓰는 것이 좋다.
왜냐하면 고정효과 모형을 통한 추정은 일치 추정량인데 랜덤효과 모형을 통한 추정은 직교성 가정이 성립할 때만 일치 추정량이다. 따라서 두 모델의 추정치가 큰 차이가 없다면 랜덤효과 모형의 추가 가정이 깨지지 않았다고 판단할 수 있다.
하우스만 가정에서 사용하는 통계량은 다음과 같다.
$$ \left( \widehat{\boldsymbol{\beta}}_{FE} - \widehat{\boldsymbol{\beta}}_{RE} \right)^\prime \left( \widehat{\mathrm{Var}[\boldsymbol{\beta}_{FE}]} - \widehat{\mathrm{Var}[\boldsymbol{\beta}_{RE}]} \right)^{-1} \left( \widehat{\boldsymbol{\beta}}_{FE} - \widehat{\boldsymbol{\beta}}_{RE} \right) \sim \chi_k^2 $$
이를 통해 두 추정치의 차이에 대한 확률을 계산할 수 있고, 귀무가설 혹은 대립가설을 기각함으로써 랜덤효과 혹은 고정효과 모형을 선택하여 사용할 수 있다.
단 주의해야 할 것은 하우스만 검정은 고정효과 모형이 옳은지를 검정하는 것이 아니다. 이 검정은 고정효과 추정량이 일치 추정량이라 가정하고 진행한다. 또한 등분산 모형을 가정하며 군집화를 허용하지 않는다. 군집 표준오차를 허용하는 하우스만 검정은 따로 수행되어야 한다.
'Economics > Causal Inference' 카테고리의 다른 글
[Causal Inference] 이중차분법(DiD)에서의 평행추세검증(parallel trends test) (0) | 2025.06.06 |
---|---|
[Causal Inference] 이중차분법(DiD, difference-in-differences) (0) | 2025.06.06 |
[Causal Inference] 랜덤효과 모형(random-effects model) (0) | 2025.06.06 |
[Causal Inference] 고정효과 모형(fixed-effects model) (0) | 2025.06.06 |
[Causal Inference] 합동 최소제곱법(pooled OLS) (0) | 2025.06.05 |