Statistics/Mathematical Statistics

[Mathematical Statistics] 분포수렴(convergence in distribution), 확률수렴(convergence in probability), 평균수렴(mean convergence), 거의 확실한 수렴(almost sure convergence), 확실한 수렴(sure convergence)
·
Statistics/Mathematical Statistics
분포수렴 (Convergence in Distribution) X1,X2, 이 확률변수의 열이며 X 를 또다른 확률변수라 하고, XnX 의 분포함수(CDF)를 각각 FXnFX 로 나타내자.limnFXn(x)=FX(x)FX 가 연속인 모든 x 에 대하여 위와 같다면 XnX 로 분포수렴한다고 하며 다음과 같이 표기한다.XndX중심극한정리(CLT)가 분포 수렴의 가장 유명한 예이다. 확률수렴 (Convergence in Probability) X1,X2, 이 확률변수의 열..
[Mathematical Statistics] 수열의 극한(limit sequence) 및 확률변수의 열(random variable sequence)
·
Statistics/Mathematical Statistics
수열의 극한 (Limit Sequence) 임의의 각 실수 ϵ>0 에 대하여 모든 nN 에 대해 |anL|anLorlimnan=L.\forall \epsilon > 0 \left( \exists N \in \mathbb{N} \left( \forall n \in \mathbb{N} \left( n \geq N \to | a_n - L | 위 수학적 정의보다 부정확하지만 말로 풀어 설명하면 n \infty a_n L a_n L $ 에 ..
[Mathematical Statistics] 체르노프 부등식(Chernoff inequality)
·
Statistics/Mathematical Statistics
체르노프 부등식 (Chernoff Inequality) 임의의 확률변수 X 와 임의의 상수 c,t>0 에 대하여 다음이 성립한다.P(Xc)E(etX)etc이는 마르코프 부등식으로 증명 가능하다.g(x)=etx 는 가역이며 g 는 강한 증가함수이다. 따라서 마르코프 부등식에 의해 다음이 성립한다.P(Xc)=P(etXetcE(etX)etc더 정확하게 증명도 가능하지만, 너무 길기에 생략한다.체르노프 부등식은 우변을 t 에 대해 최적화하여 코시-슈바르츠 부등식을 이용하는 것처럼 더 좁은 상계를 얻을 수 있다. 또한 $ ..
[Mathematical Statistics] 마르코프 부등식(Markov inequality)
·
Statistics/Mathematical Statistics
마르코프 부등식 (Markov Inequality) 러시아 수학자 안드레이 마르코프의 이름을 딴 확률론의 절대부등식으로 간단하며 굉장히 많이 사용된다. 이는 확률변수 X 과 양수 c 에 대하여 다음과 같다.E(X)cP(Xc)증명은 다음과 같다.X0 이므로 임의의 양수 c 에 대하여 다음 부등식이 성립한다.XcIXc여기서 기댓값을 취하면 다음과 같다.E(X)E(cIXc)=cE(IXc)근본가교를 적용하면 다음과 같다.E(X)cP(Xc)양변을 c 로 나누면 다음과 같다.$..
[Mathematical Statistics] 섀넌 엔트로피(Shannon entropy)와 미분 엔트로피(differential entropy) 그리고 쿨백-라이블러 발산(Kullback-Leibler divergence) 및 옌센-섀넌 발산(Jensen-Shannon divergence)
·
Statistics/Mathematical Statistics
섀넌 엔트로피 (Shannon Entropy) 정보 엔트로피(information entropy)는 확률변수의 불확실성(uncertainty)을 정량화하는 척도이다. 일반화된 레니 엔트로피(Rényi entropy)도 있지만, 확률론에서는 섀넌 엔트로피가 많이 사용된다.이산확률변수 X 의 섀넌 엔트로피 H(X) 는 다음과 같이 정의된다.H(X)=xXp(x)logp(x)보통 log 의 밑은 2 이며 XX 가 취할 수 있는 값들의 집합, 즉 치역이다. 또한 위 엔트로피의 정의에서 알 수 있지만, 엔트로피는 확률에만 의존한다.이렇게 정의된 엔트로피 H(X) 는 $ - \l..
[Mathematical Statistics] 옌센 부등식(Jensen inequality)
·
Statistics/Mathematical Statistics
옌센 부등식 (Jensen Inequality) 일반적으로는 젠센 부등식으로 부른다. 덴마크 수학자 요한 옌센에 의해 발표된 부등식으로 옌센이라 부르는 것이 올바르겠으나 영어식 발음인 젠센으로 많이 불리는 것이다. 옌센 부등식은 다음과 같다.확률변수 X 에 대하여 g 가 볼록(convex) 함수라면 E(g(X))g(E(X)) 이다. 만일 g 가 오목(concave) 함수라면 E(g(X))g(E(X)) 이다. 두 경우 모두에서 등식이 성립하는 유일한 조건은 확률 1g(X)=a+bX 가 성립하는 상수 ab 가 존재하는 것이다. 증명은 다음과 같다.만일 g 가 볼록 함수라면 g 에 대한 모든 접..
[Mathematical Statistics] 코시-슈바르츠 부등식(Cauchy–Schwarz inequality)
·
Statistics/Mathematical Statistics
코시-슈바르츠 부등식 (Cauchy–Schwarz Inequality) 절대부등식으로 일반적인 형태는 아래와 같다.v2w2|vw|2여기서 는 벡터의 크기(참고링크)이고, 은 벡터의 내적(참고링크)이다.이를 확률론에 끌어와 사용할 때는 일반적으로 아래와 같이 사용한다.E(X2)E(Y2)E(XY)2증명은 다음과 같다.E[(YtX)2]=E(Y2)2tE(XY)+t2E(X2)0위 식을 t 로 편미분하고 0 으로 놓으면 다음과 같다.$ \dfrac{\partial}{\partial t} E[(Y-tX)^2] = -2E(XY) + 2t..
[Mathematical Statistics] F-분포(F-distribution)
·
Statistics/Mathematical Statistics
F-분포 (F-distribution) 어떤 확률변수 W1W2 가 독립이며 자유도가 각각 ν1, ν2 인 카이제곱분포를 따를 때 F 가 다음과 같이 정의된다면 F 는 분자의 자유도가 ν1 이고 분모의 자유도가 ν2 인 F-분포를 따른다.F=W1/ν1W2/ν2F(ν1,ν2)즉 카이제곱분포를 따르는 두 확률변수의 비율이 F-분포를 따른다.참고로 당연하겠지만, FF(ν1,ν2) 일 때 1FF(ν2,ν1) 이다. 더하여 F-분포의 누적분포를 Fα 로 나타낸..
[Mathematical Statistics] t-분포(Student's t-distribution)
·
Statistics/Mathematical Statistics
t-분포 (Student's t-Distribution) 분포 자체와는 별 상관 없는 이야기지만 이름에 Student가 붙은 이유는 이 분포를 제안한 윌리엄 고셋이 해당 논문을 낼 때 가명으로 Student를 사용했기 때문이다.ZN(0,1)Wχ2(ν) 에 대하여 ZW 가 독립일 때 T=Z/W/ν 라면 Tt-분포를 따른다고 하며 다음과 같다.T=ZW/νt(ν)이를 응용할 수 있다. i.i.d.인 Xi (i=1,2,,n) 에 대하여 $ X \sim N(\mu, \sigma^2) ..
[Mathematical Statistics] 카이제곱분포(chi-square distribution)
·
Statistics/Mathematical Statistics
카이제곱분포 (Chi-Square Distribution) 카이제곱분포는 감마분포의 특수한 형태이면서 k 개의 서로 독립적인 표준정규분포를 따르는 확률변수를 제곱한 다음 합하여 얻어지는 확률변수의 분포이다. 즉 XiN(μ,σ2) (i=1,2,,n) 에 대하여 Zi=(Xiμ)/σ 일 때 Zi2 의 합, i=1nZi2 은 자유도가 n 인 카이제곱분포를 따른다.i=1nZi2χ2(n)참고로 표본을 추출하여 만들어지는 표본분산 S2 을 이용한 (n1)S2/σ2 은 자유도가 $ n-1 ..
애스터로이드