코크란-오컷 방법 (Cochrane-Orcutt Method)
더빈–왓슨 검정을 통해 자기상관이 존재한다고 판단되면, 이를 개선하기 위해 다양한 방법을 고려할 수 있다. 예를 들어, 자기상관이 특정 변수의 누락으로 인해 발생한 것이라면 그 변수를 모델에 추가함으로써 자기상관을 줄일 수 있다. 하지만 예측 변수를 추가해도 잔차의 자기상관이 제거되지 않는다면, 오차의 자기상관 구조를 명시적으로 모델에 반영하고 이에 적합한 추정 방법을 사용해야 한다.
이때 자주 사용되는 방법이 바로 코크란–오컷 방법이다. 먼저 단순선형회귀모형에서 오차가 1차 자기상관을 가진다고 가정한다.
$$ y_t = \beta_0 + \beta_1 x_t + \epsilon_t , \qquad \epsilon_t = \phi \epsilon_{t - 1} + a_t $$
이때 설명변수와 반응변수를 다음과 같이 변환한다.
$$ y_t^\prime = y_t - \phi y_{t-1} , \qquad x_t^\prime = x_t - \phi x_{t-1} $$
이를 이용해 원래 모델을 다시 정리하면 다음과 같다.
$$ y_t^\prime = [\beta_0 + \beta_1 x_t + \epsilon_t] - \phi [\beta_0 + \beta_1 x_{t-1} + \epsilon_{t-1}] = \beta_0 ( 1 - \phi) + \beta_1 (x_t - \phi x_{t-1}) + (\epsilon_t - \phi \epsilon_{t-1}) $$
이때 새롭게 정의된 오차항 $ \epsilon_t - \phi \epsilon_{t-1} $ 서로 독립적으로 볼 수 있다. 하지만 이 모델은 $ \phi $ 라는 미지의 파라미터가 포함되어 있으므로 단순한 최소제곱법으로는 직접 추정할 수 없다. 그러나 오차항 $ \epsilon_t $ 가 $ AR (1) $ 구조, 즉 $ \epsilon_t = \phi \epsilon_{t-1} + a_t $ 를 따른다고 보면 $ \phi $ 는 원래 회귀모델 적합 후에 얻은 잔차 $ e_t $ 를 이용하여 다음과 같이 추정 가능하다.
$$ \hat{\phi} = \frac{\sum_{t=2}^T e_t e_{t-1}}{\sum_{t=1}^T e_t^2} $$
그 다음 $ \hat{\phi} $ 로 $ y_t^\prime $, $ x_t^\prime $ 을 계산해 변환된 모델에 최소제곱법을 적용하면 새 계수 $ \hat{\beta}_0^\prime $, $ \hat{\beta}_1 $, $ \hat{a}_t $ 를 얻을 수 있다.
$$ \beta_0^\prime = \beta_0 (1 - \phi) , \qquad x_t^\prime = x_t - \phi x_{t-1}, \qquad \hat{a}_t = \hat{\epsilon}_t - \hat{\phi} \hat{\epsilon}_{t-1} $$
이 잔차들로 다시 더빈–왓슨 검정을 수행하고, 여전히 자기상관이 존재한다면 $ \phi $ 를 다시 추정하고 위 과정을 반복한다. 이러한 방식으로 점차 자기상관이 제거된 회귀모형을 얻을 수 있다.
예측과 예측구간
시간 $ T $ 시점까지의 데이터를 가지고 $ T + 1 $ 시점 이후의 값을 예측하려 할 때 단순히 다음과 같이 예측하는 것은 오차항이 자기상관되어 있을 경우 적합하지 않다.
$$ \hat{y}_{T + 1} = \hat{\beta}_0 + \hat{\beta}_1 x_{T+1} $$
왜냐하면 실제로는 다음과 같이 영향을 미치기 때문이다.
$$ y_t = \phi y_{t-1} + (1 - \phi) ( \beta_0 + \beta_1 x_t) - \phi x_{t-1} + \epsilon_t $$
$ x_T $ 와 $ y_T $ 는 시점 $ T $ 에서 이미 알려져 있지만, $ T+1 $ 시점에서는 모른다. $ \epsilon_{T+1} $ 의 기댓값은 $ 0 $ 이므로 최적 추정치로는 $ 0 $ 을 둔다. 결과적으로 시점 $ T $ 에서 $ T + 1 $ 시점을 예측할 때 사용할 수 있는 식은 다음과 같다.
$$ \hat{y}_{T+1}(T) = \hat{\phi} y_T + ( 1 - \hat{\phi})(\hat{\beta}_0 + \hat{\beta}_1 x_{T+1}) - \hat{\phi} x_T $$
예측구간을 구하려면 예측 오차의 분산이 필요한데 1단계 앞 예측오차는 $ \epsilon_{T+1} $ 이 주된 요인이 되므로 그 분산은 $ \sigma^2_a $, 즉 $ AR(1) $ 모형 추정 시에 얻어진 추정치로 계산할 수 있다.
$$ y_{T+1} - \hat{y}_{T+1}(T) = \epsilon_{T+1} \Longrightarrow \mathrm{Var}(y_{T+1} - \hat{y}_{T+1}(T)) = \sigma^2_a $$
따라서 예측구간은 다음과 같다.
$$ \hat{y}_{T+1} (T) \pm z_{\alpha /2}\hat{\sigma}_a $$
$ \tau $ 시점 뒤 예측의 경우 오차항이 누적되므로 다음과 같이 식이 복잡해진다.
$$ y_{T + \tau} - \hat{y}_{T + \tau}(T) = \epsilon_{T + \tau} + \phi \epsilon_{T+\tau-1} + \cdots + \phi^{\tau - 1} \epsilon_{T+1} $$
'Statistics > Time Series Analysis' 카테고리의 다른 글
[Time Series Analysis] 2차 지수평활법(second-order exponential smoothing) (0) | 2025.04.09 |
---|---|
[Time Series Analysis] 1차 지수평활법(first-order exponential smoothing) (0) | 2025.04.09 |
[Time Series Analysis] 더빈-왓슨 검정(Durbin-Watson test) (0) | 2025.04.07 |
[Time Series Analysis] 선형회귀모델 적합성 확인(adequacy checking) (0) | 2025.04.07 |
[Time Series Analysis] 선형회귀모델 예측(prediction) (0) | 2025.04.07 |