인과추론 (Causal Inference)
통계학을 배우면 상관관계에 대해 배우게 된다. 상관관계를 나타내는 피어슨 상관계수는 두 변수 간의 선형적 관계를 측정하는데, 여기서 가장 주의해야 할 점은 비선형적인 관계는 포착하지 못한다는 것과 인과관계를 보여주는 것이 아니라는 점이다.
상관관계는 $X \leftrightarrow Y$ 로 표현할 수 있다. 이는 어느 한쪽이 다른 한쪽에 일방적으로 영향을 주는 것이 아니라, 서로 영향을 주고받는 관계이기 때문이다. 반면, 인과관계는 $X \rightarrow Y$ 처럼 한 방향으로 표현할 수 있다. 즉, 명확하게 $Y$ 에 영향을 주는 $X$ 를 찾는 것이 목표이다. 예를 들어, 건강보험이 건강에 미치는 영향이나, 소득이 교육에 미치는 영향을 분석하는 것은 $X \rightarrow Y$ 형태로 표현할 수 있다.
그러나 이러한 인과관계를 분석하는 과정에는 여러 장애물이 존재한다. 예를 들어, 건강보험이 건강에 미치는 영향을 알고 싶다고 가정해 보자. 이를 위해 건강보험 가입자와 비가입자의 데이터를 비교한다고 하자. 그런데 데이터를 살펴보니, 건강보험에 가입한 사람들의 건강 상태가 비가입자보다 오히려 더 나쁜 것으로 나타났다면, 건강보험이 건강에 악영향을 미친 것이라고 결론 내릴 수 있을까? 당연히 그렇지 않다. 건강 상태가 좋지 않은 사람들이 건강보험에 가입할 확률이 더 높을 수도 있기 때문이다. 즉, 건강보험이 건강에 영향을 준 것이 아니라, 오히려 건강 상태가 건강보험 가입 여부에 영향을 미쳤을 가능성이 있다.
이처럼 다양한 변수가 개입할 가능성이 있는 데이터를 바탕으로는 인과관계를 정확히 파악하기 어렵다. 즉 내생성(endogeneity) 문제가 있다. 따라서 '다른 조건이 동일하다면(ceteris paribus)' 이라는 전제가 필요하다. 하지만 현실에서는 이러한 조건을 충족시키기 어렵기 때문에, 이를 극복하기 위해 다양한 실증적 전략(empirical strategies)이 활용된다.
실험연구와 관찰연구 (Experiments and Observational study)
관찰연구는 연구자가 특정 요인이 어떤 영향을 미치는지 관찰하지만, 직접 조작하지는 않는다. 반면 실험연구는 연구자가 직접 개입하여 그 영향을 분석한다.
관찰연구의 대표적 방법론으로는 코호트 연구(cohort study)가 있다. 코호트란 '특정한 행동양식 등을 공유하는 집단'이라는 뜻으로 특정 기준에 따라 연관된 그룹을 말한다. 예를 들어 출생 코호트는 특정 기간 동안 태어난 사람들을 포함한다. 연구자는 이 경우 특정 변수에 노출된 코호트 구성원과 그렇지 않은 구성원을 비교하여 차이를 분석한다.
그러나 이러한 관찰연구에 경우 앞서 말한바와 같이 통제되지 않은 요인, 즉 혼동요인(confounding factor)이 영향을 줄 가능성이 존재한다. 따라서 관찰연구를 통해 인과추론을 진행하면 문제가 발생할 수 있다.
예를 들어보자. 병원이나 약국에서 약을 처방할 때 이에 잘 따르는 순응자(adherer)와 비순응자(non-adherer)를 비교할 때 순응자가 더 사망률이 낮은 것을 근거로 처방이 효과가 있다고 말할 수 있을까? 관찰연구를 통해 얻을 수 있는 데이터로는 여기까지가 한계일 것이고, 이를 근거로 처방에 대한 효과를 말할수도 있다. 그러나 순응자와 비순응자는 건강에 대한 태도 및 생에 대한 애착 정도가 다를 것이다. 즉 건강에 훨씬 더 관심이 있고 자신을 더 잘 보살피는 사람이 순응자가 될 것이라 유추할 수 있다. 그렇다면 과연 처방이 효과적이었던 것일까, 아니면 순응자가 자신을 더 잘 보살폈기 때문에 사망률이 낮은 것일까는 알 수 없어진다.
또 혼동요인이 통제되지 않았을 때 심슨의 역설(Simpson's paradox)이 나타날 수 있다. 하위집단에서 관찰된 관계는 이 하위집단들이 결합되었을 때 그 관계가 바뀌어 나타날 수 있는데 이를 심슨의 역설이라 한다. 대표적 예시가 1973년 초 UC 버클리 대학의 대학원 입학 사례이다. 이때 지원자 수 대비 입학률을 보면, 12763명의 지원자가 101개 학과 및 학과간 전공 중 하나에 지원하였는데, 지원한 4321명의 여성 중 대략 35%가 합격한 반면 지원한 8442명의 남성 중 44%가 합격했다. 그렇다면 이를 두고 해당 대학 대학원이 남성을 여성보다 선호한다고 말할 수 있을까? 그렇지 않다. 이는 전체 단위에서의 평균만 고려하였기에 내려진 결론이었다. 쉽게 설명하자면 합격률이 낮은 학과에 여성이 몰렸고, 합격률이 높은 학과에 남성이 몰렸기 때문에 나타난 결과였다. 합격률이 높은 학과에 남성이 몰렸기 때문에 합격 남성이 많았고, 반대로 여성은 합격자가 적었다. 각 학과별로 보면 남성과 여성의 합격률 차이가 거의 없었음에도 이를 합쳐서 본 전체 단위에서의 합격률은 차이가 났던 것이다.
이처럼 관찰연구의 한계 때문에 연구자가 직접 변인을 통제하는 실험연구가 인과추론에서는 더 적합하다. 실험연구는 뒤에서 다시 다루겠지만, 특정 처리를 한 처리집단(treatment group)과 처리하지 않은 통제집단(control group)으로 나누고 이 두 집단을 비교함으로써 인과추론을 한다. 처리집단과 통제집단을 구분할 때는 혼동요인을 배제하기 위해 무작위로 배정(randomized control)해야 한다. 또한 이중 눈가림(double blindness), 즉 실험자와 피실험자 모두 처리 여부에 따른 영향을 줄이기 위해 처리 여부를 알 수 없어야 한다.
그러나 생각해보면 사회과학에서 이러한 방법을 사용할 수 있을까? 예를 들어 흡연이 건강에 미치는 영향을 조사하기 위해 비슷한 조건의 사람 백여명을 모아 일부 집단에는 흡연을 하도록 시킬 수 있을까? 그 외 다양한 실험을 하려고 해도 윤리적, 실험을 위한 자금 문제로 어려울 가능성이 높다.
이럴 때 활용할 수 있는 또 하나의 방법 중 하나가 자연실험(natural experiment)이다. 준실험(quasi-experiment)이라고 하기도 한다. 혼동요인이 거의 통제되었을 것이라 가정되는 상황이 자연적으로 발생하는 경우 자연실험이라 하고 이를 통해 인과추론을 진행해볼 수 있다. 예를 들어 1969년 전공투로 도쿄대는 입학생을 받지 못했다. 그렇다면 이를 활용해 도쿄대 프리미엄이 존재하는지에 대해 인과추론해볼 수 있다. 일반적인 상황에서 도쿄대 출신을 타대학 출신과 그대로 비교하는 것은 부적절하지만, 1969년 상황을 볼 때 도쿄대를 갈 수 있었던 사람들이 도쿄대를 못 갔으므로 이들을 1968년과 1970년 도쿄대 입학생과 비교하면 도쿄대 프리미엄이 존재하는지 확인할 수 있을 것이다.
결론적으로 정리하면 결국 인과추론을 위해서는 영향을 주는 변수 $ X $ 와 영향을 받는 변수 $ Y $ 외 변수인 혼동요인을 가능한 배제해야 한다. 혼동요인을 배제해야 제대로된 인과추론이 가능하고, 이를 가능하게 하는 것은 관찰연구보다는 실험연구이다.