반복측정 분산분석
각 $ x_i $ 의 수준에서 $ n _i $ 개의 반복적인 데이터가 있는 경우 적합결여검정(참고링크)과 유사하게 다음과 같이 모형을 만들고 검정해야 한다.
$$ y_{ij} = \beta_0 + \beta_1 x_i + \epsilon_{ij}, \qquad ( \epsilon \sim N(0, \sigma^2) )$$
여기서 $ i = 1, 2, \cdot, k $ 는 각 $ x $ 값에 대한 것이고, $j = 1, 2, \cdot, n_i $ 는 $ x_i $ 에서의 $ y $ 관측값에 대한 것이다.
이제 분산분석에 필요한 $SSE $, $ SSR $, $ SST $ 를 구하기 위해 $ \bar{x} $ 와 $ \bar{y} $ 에 대해 다음과 같이 정의하자.
$$ \bar{y} = \frac{\sum_{i}\sum_{j}y_{ij}}{\sum_{i} n_i} $$
$$ \bar{x} = \frac{1}{\sum_i n_i} \sum_i (n_i x_i) $$
이를 이용하여 $ SST $, $ SSR $, $ SSE $ 를 다음과 같이 계산할 수 있다.
$$ SST = \sum_i \sum_j (y_{ij} - \bar{y})^2 $$
$$ SSR = \frac{\left(\sum_i \sum_j (x_i - \bar{x})(y_{ij} - \bar{y}) \right)^2}{\sum_i \sum_j (x_i - \bar{x})^2} $$
$$ SSE = SST - SSR $$
그리고 이를 활용하여 다음과 같이 분산분석표를 작성할 수 있다.
요인 | 제곱합 | 자유도 | 평균제곱 | $ F_0 $ |
회귀 | $ SSR $ | $1 $ | $ MSR $ | $ F_0 = MSR / MSE $ |
잔차 | $ SSE $ | $ n-2 $ | $ MSE $ | |
계 | $ SST $ | $ n - 1$ |
그리고 모형은 다음과 같이 추정할 수 있다.
$$ \hat{\beta}_1 = \frac{\sum_i \sum_j (x_i - \bar{x})(y_{ij} - \bar{y})}{\sum_i \sum_j (x_i - \bar{x})^2} , \quad \hat{\beta}_0 = \bar{y} - \hat{\beta}_1 \bar{x} $$
즉 분산분석 결과 유의미하다고 판별되면 위 식을 이용하여 회귀식을 추정할 수 있다고 말할 수 있다.
'Statistics > Regression Analysis' 카테고리의 다른 글
[Regression Analysis] 다중회귀분석(multiple regression analysis) (0) | 2025.04.02 |
---|---|
[Regression Analysis] 이차형식(quadratic forms)의 분포 (0) | 2025.04.02 |
[Regression Analysis] 두 회귀선 비교(comparison of regression lines) (0) | 2025.03.26 |
[Regression Analysis] 단순선형회귀모형 변환(transformations) (0) | 2025.03.26 |
[Regression Analysis] 단순선형회귀모형의 타당성 (0) | 2025.03.24 |