이중차분법 (DiD, Difference-in-Differences)
인과추론에서 인과적 결과를 추정할 때는 처치에 대한 잠재적 결과(potintial outcome)의 차이를 추정한다. 먼저 잠재적 결과는 다음과 같다.
$$ \text{potential outcomes} = \begin{cases} Y_{1i} & (D_i = 1) \\ Y_{0i} & (D_i = 0) \end{cases} $$
그렇다면 추정하는 것은 다음과 같다.
$$ E \left[Y_{1i} \mid D_i = 1 \right] - E \left[ Y_{0i} \mid D_i = 0 \right] $$
그러나 이러한 잠재적 결과는 동시에 관찰이 불가능하다.
이제 이를 이중차분법으로 추정하기 위해 다음과 같이 가정하자.
$$ E \left[ Y_{oist} \mid s, t \right] = \gamma_s + \lambda_t $$
즉 어떤 결과는 해당 그룹 $ s $ 의 효과 $ \gamma_s $ 와 해당 시간 $ t $ 의 효과 $ \lambda_t $ 의 합으로 결정된다는 것이다.
이때 $ D_{st} $ 를 처치 그룹 및 처치 시점에 대한 더미 변수라 하자. 즉 처치 그룹이고 처치 시점이면 $ D_{st} = 1 $ 이다. 이때 처치 효과는 다음과 같을 것이다.
$$ E \left[ Y_{1ist} - Y_{0ist} \mid s, t \right] = \delta $$
그렇다면 관측된 결과(observed outcomes)는 다음과 같다.
$$ Y_{ist} = \gamma_s + \lambda_t + \delta D_{st} + \epsilon_{ist} $$
여기서 $ \epsilon_{ist} $ 는 오차(error)이다.
이제 $ s $ 를 처지 집단 $ T $ 와 통제 집단 $ C $ 로 나눠 생각하고, 시점 $ t $ 를 처치 전 $ B $ 와 처치 후 $ A $ 로 생각하면 각 집단 및 시점에서 결괏값(outcomes)은 다음과 같다.
$$ E \left[ Y_{ist} \mid s = T, t = B \right] = \gamma_T + \lambda_B $$
$$ E \left[ Y_{ist} \mid s = T, t = A \right] = \gamma_T + \lambda_A + \delta $$
$$ E \left[ Y_{ist} \mid s = C, t = B \right] = \gamma_C + \lambda_B $$
$$ E \left[ Y_{ist} \mid s = C, t = A \right] = \gamma_C + \lambda_A $$
그렇다면 처치 집단에서 처치 시점에 따른 변화는 다음과 같다.
$$ E \left[ Y_{ist} \mid s = T, t = A \right] - E \left[ Y_{ist} \mid s = T, t = B \right] = (\gamma_T + \lambda_A + \delta) - (\gamma_T + \lambda_B) = \delta + \lambda_A - \lambda_B $$
통제 집단에서는 다음과 같다.
$$ E \left[ Y_{ist} \mid s = C, t = A \right] - E \left[ Y_{ist} \mid s = C, t = B \right] = (\gamma_C + \lambda_A) - (\gamma_C + \lambda_B) = \lambda_A - \lambda_B $$
이제 처치 집단내 처치 시점에 따른 변화에서 통제 집단내 처치 시점에 따른 변화를 확인하자.
$$ \left( E \left[ Y_{ist} \mid s = T, t = A \right] - E \left[ Y_{ist} \mid s = T, t = B \right] \right) - \left( E \left[ Y_{ist} \mid s = C, t = A \right] - E \left[ Y_{ist} \mid s = C, t = B \right] \right) $$
$$ = \left( \delta + \lambda_A - \lambda_B \right) - \left( \lambda_A - \lambda_B \right) = \delta $$
이렇듯 이중차분법은 이름 그대로 두 번의 차분(difference)을 통해 처치 효과(treatment effects)를 추정하는 방법이다.
간략하게는 특정 시점에서 일어난 처치에 대해 처치 집단(treatment group)과 통제 집단(control group)에서 처치 전후 수준을 차분하여 각 집단의 변화를 구하고, 이를 다시 차분하여 그 효과를 추정한다. 즉 위에서의 추정일 일반화 시켜 쓰면 다음과 같다.
$$ \text{treatment effects} = \left( \bar{Y}_{TA} - \bar{Y}_{TB} \right) - \left( \bar{Y}_{CA} - \bar{Y}_{CB} \right) $$
여기서 $ T $ 는 처치 집단, $ C $ 는 통제 집단, $ A $ 는 사후, $ B $ 는 사전이다.
표로 보면 다음과 같이 볼 수 있겠다.
$$ \begin{array}{c|c|c} & \quad \text{Before Treatment} \quad & \quad \text{After Treatment} \quad \\ \\ \hline \\ \text{Treatment Group} \quad & \bar{Y}_{TB} & \bar{Y}_{TA} \\ \\ \hline \\ \text{Control Group} \quad & \bar{Y}_{CB} & \bar{Y}_{CA} \\ \text{ } \end{array} $$
여기서 횡단면 차분은 $ \bar{Y}_{TA} - \bar{Y}_{TB} $, $ \bar{Y}_{CA} - \bar{Y}_{CB} $ 를, 종단면 차분은 $ \bar{Y}_{TA} - \bar{Y}_{CA} $, $ \bar{Y}_{TB} - \bar{Y}_{CB} $ 를 말한다.
즉 횡단면 차분값에서 종단면 차분값을 빼는 것으로 두 번의 차분이 이루어 진다.
그러나 이중차분법을 사용하기 위해서는 가장 중요한 두 가정이 필요하다. 먼저 공통 추이(common trend)가 있어야 한다. 즉 각 시점에 따른 효과, 위에서 $ \lambda $ 라 가정한 효과가 일정하다고 볼 수 있어야 한다.
예를 들어서 위와 같이 처치 집단과 통제 집단이 시간에 따라 비슷한 양상을 나타내면 이중차분법을 사용하기 적합하다. 그러나 아래와 같이 너무 차이가 크다면 이중차분법을 사용하기 적합하지 않다.
또 다른 가정으로 사전 추이(pre-trends)가 비슷하더라도 동시에 시행된 다른 처치의 영향을 받을 가능성이 없어야 한다. 예를 들어서 이중차분법을 통해 연금이 건강에 미치는 영향을 조사하려 하는데 연금을 받는 연령에 퇴직도 동시에 이루어진다면 이중차분법으로 추정된 건강에 대한 효과가 연금에 의한 것인지 퇴직에 의한 것인지 확인할 수 없기 때문이다.
회귀 모형
일반화시켜 회귀 모델로 나타내면 다음과 같이 나타낼 수 있다.
$$ \text{outcome}_{it} = \beta_0 + \beta_1 T_i + \beta_2 P_t + \beta_3 (T \times P)_{it} + \epsilon_{it} $$
여기서 $ T $ 는 처치 집단인지를 나타내는 더미 변수(dummy variable)이고, $ P $ 는 처치 후인지 여부를 나타내는 더미 변수(dummy variable)이다.
즉 $ \beta_0 $ 는 통제 집단의 처치 전 효과이고, $ \beta_0 + \beta_2 $ 는 통제 집단의 처치 후 효과이며, $ \beta_0 + \beta_1 $ 은 처치 집단의 처치 전 효과, $ \beta_0 + \beta_1 + \beta_2 + \beta_3 $ 이 처치 집단의 처치 후 효과이다.
여기서 이중차분 추정량은 $ \beta_3 $ 이다.
삼중차분법 (DDD, Difference-in-Differences-in-Differences)
이중차분법을 응용하면 삼중차분도 가능하다. 이중차분법에서는 통제집단과 처치집단, 처치 전과 후의 차이를 이용했는데, 삼중차분에서는 제3의 집단 또는 제3의 시점 또는 제3의 처치 강도 차원을 도입하여 다른 차원에서 발생할수 있는 편향을 통제한다.
예를 들어서 소비자가 계산대에 붙이는 사후 부과(post-transaction) 세금에는 덜 민감하게 반응하고, 진열 가격에 세금을 포함(tax-inclusive)하는 것에는 크게 반응한다는 가설을 검정하기 위해 다음과 같은 실험을 설계했다.
먼저 특정 마트에 특정 상품에 대해 사후 세금을 표기한다. 그렇다면 상품 차원에서는 실험 대상 상품과 그렇지 않은 나머지 통제 상품으로 나눠진다. 마트 차원에서 생각해보자. 실험이 진행된 마트와 그렇지 않은 마트로 나뉜다. 마지막으로 시간 차원으로 생각해보면 실험이 이뤄지기 전과 후로 나뉜다.
그렇다면 삼중차분모형은 다음과 같다.
$$ \Delta^3 y = \left[ (y_{\text{A, TP, TS}} - y_{\text{B, TP, TS}}) - (y_{\text{A, CP, TS}} - y_{\text{B, CP, TS}}) \right] - \left[ (y_{\text{A, TP, CS}} - y_{\text{B, TP, CS}}) - (y_{\text{A, CP, CS}} - y_{\text{B, CP, CS}}) \right] $$
여기서 $ A $ 는 사후(after), $ B $ 는 사전(before), $ T $ 는 처치(treatment), $ C $ 는 통제(control), $ P $ 는 상품(product), $ S $ 는 매장(store)이다.
이렇게 하면 기존 이중차분법으로는 분리하기 힘든 상품 카테고리, 매장, 시간의 상호작용 효과를 식별할 수 있고, 보다 정확한 추정이 가능해진다.
다만, 세 번의 차분이 있다고 해서 반드시 삼중차분법이 성립하는 것은 아니다. 차분은 선택편향이 발생하지 않는 차원에서 이루어져야 하며, 편향이 발생할 수 있는 차원을 기준으로 차분을 수행하면 추정값에 왜곡이 생길 수 있다.
'Economics > Causal Inference' 카테고리의 다른 글
[Causal Inference] 조건부 독립 가정(CIA, conditional independence assumption) (0) | 2025.06.07 |
---|---|
[Causal Inference] 이중차분법(DiD)에서의 평행추세검증(parallel trends test) (0) | 2025.06.06 |
[Causal Inference] 하우스만 검정(Hausman test) (0) | 2025.06.06 |
[Causal Inference] 랜덤효과 모형(random-effects model) (0) | 2025.06.06 |
[Causal Inference] 고정효과 모형(fixed-effects model) (0) | 2025.06.06 |