체비쇼프 부등식 (Chebyshev Ineuality)

 

절대부등식으로 확률분포를 정확히 모를 때 해당 확률분포의 기댓값과 표준편차 값만으로 특정한 확률의 최솟값만큼은 알아낼 수 있는 부등식이다.

확률분포 $ X $ 의 기댓값을 $ \mu $, 표준편차를 $ \sigma $ 라 하면 다음이 성립한다. 단 $ k $ 는 양의 상수이다.

$ P(|X-\mu|<k\sigma) \geq 1-\dfrac{1}{k^2} $ 또는 $ P(|X-\mu| \geq k\sigma) \leq \dfrac{1}{k^2} $

이는 확률분포와 상관없이, 즉 이산확률분포이든 연속확률분포이든 성립한다.

증명은 다음과 같다. 이때 $ X $ 를 연속확률변수라 가정하였다.

$ V(X) = \int_{-\infty}^\infty (x - \mu)^2 f(x) dx $

$ = \int_{-\infty}^{\mu -k\sigma} (x - \mu)^2 f(x) dx + \int_{\mu -k\sigma}^{\mu+k\sigma} (x - \mu)^2 f(x) dx + \int_{\mu+k\sigma}^\infty (x - \mu)^2 f(x) dx $

두번째 적분은 항상 $0$ 이상이고, 첫번째, 세번째 적분은 적분범위 내의 모든 $ x $ 값에 대해 $ (x-\mu)^2 \leq k^2 \sigma^2 $ 이다. 이때 두번째 적분에 $0$ 을 대입하고, 첫번째, 세번째 적분의 $ (x - \mu)^2 $ 에 $ k^2 \sigma^2 $ 을 대입하면 다음 부등식을 얻는다.

$ V(X) \geq \int_{-\infty}^{\mu -k\sigma} k^2 \sigma^2 f(x) dx + \int^\infty_{\mu +k\sigma} k^2 \sigma^2 f(x) dx $

이를 통해 다음을 얻는다.

$ \sigma^2 \geq k^2 \sigma^2 \left[ P(Y \leq \mu - k \sigma) + P(Y \geq \mu + k \sigma) \right] = k^2 \sigma^2 P( |Y- \mu | \geq k \sigma ) $

따라서 $ P(|X-\mu|<k\sigma) \geq 1-\dfrac{1}{k^2} $ 또는 $ P(|X-\mu| \geq k\sigma) \leq \dfrac{1}{k^2} $ 가 성립한다.

 

애스터로이드