Loading [MathJax]/jax/output/CommonHTML/jax.js

제곱합의 분포

 

분산분석(ANOVA)을 할 때 자연스럽게 F0=MSR/MSE 를 이용해 검정하였다. 즉 F0 가 F분포를 따른다고 보고 검정하였다. 이때 F0 가 왜 F분포를 따르는지 좀 더 엄밀하게 확인해보겠다.

아래와 같은 다중회귀모형을 가정하자.

y=Xβ+ϵ,(ϵN(0n,σ2In))

총 제곱합 SST 는 다음과 같다.

SST=ni=1(yiˉy)2=yTyn(ˉy)2=y(In1n×nn)y

이때 yN(Xβ,σ2In) 이라는 것과, (In1n×n/n) 은 멱등행렬(idempotent matrix)이라는 것, 계수(rank)는 n1 라는 것을 생각하면 다음이 성립한다. (참고링크 - 정리 1)

SSTσ2χ2(n1,12σ2βTXT(In1n×nn)Xβ)

즉 비중심카이제곱분포를 따른다.

이제 SSR 에 대해 살펴보면 다음과 같다.

SSR=yTX(XTX)1XTyn(ˉy)2=yT[X(XTX)1XT1n×nn]y

이때 [X(XTX)1XT1n×n/n] 는 멱등행렬이고, 그 계수(rank)는 p 이다. 따라서 다음을 얻는다.

SSRσ2χ2(p,12σ2βTXT(In1n×nn)Xβ)

이제 SSE 에 대해 살펴보면 다음과 같다.

SSE=yT[InX(XTX)1XT]y

여기서 [InX(XTX)1XT] 는 멱등행렬이며 계수(rank)는 np1 이다.

또한 (Xβ)T[InX(XTX)1XT](Xβ)=0 이므로 다음이 성립한다.

SSEσ2χ2(np1)

 


SSRSSE 의 독립성

 

SSRSSE 가 독립인지 확인하기 위해 다음과 같이 설정하자. (참고링크 - 정리 3)

yN(Xβ,σ2In=V)

yTAy=yT[X(XTX)1XT1n×n/nσ2]y

yTBy=yT[X(InXTX)1XTσ2]y

이제 독립인지 확인하기 위해 AVB 를 확인하면 다음과 같다.

AVB=0n×n

따라서 SSRSSE 는 서로 독립적으로 분포한다.

 


F-분포

 

SSRSSE 가 서로 독립적으로 다음과 같이 분포한다는 것을 확인하였다.

SSRσ2χ2(p,λ),(λ=12σ2βTXT(In1n×nn)Xβ)

SSEσ2χ2(np1)

이제 검정통계량 F0 를 다음과 같이 가정하자.

F0=MSRMSE=SSRσ2/pSSEσ2/(np1)

분자는 비중심모수가 λ 인 비중심 카이제곱분포를 따르고, 분모는 카이제곱분포를 따르므로 다음과 같다.

F0F(p,np1,λ)

즉 비중심 F-분포를 따른다.

그런데 분산분석에서 귀무가설은 H0:β1=β2==βp=0 이다. 즉 귀무가설이 성립한다면 λ=0 이므로 다음과 같다.

F0F(p,np1)

결국 유의수준 α 에서 귀무가설을 기각할 수 있는지 여부를 확인할 수 있다.

 

애스터로이드