불연속함수의 기댓값
확률변수 $ X $ 가 연속확률변수를 따르는 듯 보이지만, 연속확률변수가 끊어져 연속이 성립하지 않는 경우가 있을 수 있다.
예를 들어 확률변수 $ X $ 가 어느 생수 업체의 일간 판매량이고 다음의 확률밀도함수를 가진다고 하자.
$$ f(x) = x^2 \qquad 0 \leq x \leq 2 $$
이때 판매량에 대한 수익 $ g(X) $ 가 다음과 같다고 가정하자.
$$ g(X) = \begin{cases} 100X & 0 \leq X \leq 1 \\ 150X & 1 < X \leq 2 \end{cases} $$
그렇다면 판매량에 대한 수익이 따르는 분포는 연속적이지 않다. 이 경우 연속확률변수에 대한 기댓값 정의를 사용하여 구할 수 있다.
$$ E(X) = \int_{-\infty}^\infty g(x)f(x) dx = \int_0^1 100x \cdot x^2 dx + \int_1^2 150x \cdot x^2 dx = 587.5 $$
혼합분포 (Mixed Distribution)
이산확률변수와 연속확률변수가 섞여있는 분포가 있을 수도 있다.
예를 들어 확률변수 $ X $ 의 누적분포함수가 다음과 같다고 가정해보자.
$$ F(x) = c_1 F_1(x) + c_2 F_2(x) $$
이때 $ F_1(x) $ 가 이산분포함수이고, $ F_2(x) $ 가 연속분포함수이며, $ c_1 $ 과 $ c_2 $ 는 각각 이산인 점들과 연속인 부분에서 누적된 확률이라 해보자.
그렇다면 확률변수 $ X $ 는 이산확률변수도 아니고 연속확률변수도 아닌 혼합확률변수라 할 수 있다. 이때 $ X $ 가 따르는 누적분포함수를 혼합분포함수라 한다.
$ X $ 의 기댓값은 기댓값의 선형성에 의해 다음과 같다.
$$ E(X) = c_1 E(X_1) + c_2 E(X_2) $$
이때 $ X_1 $ 은 $ F_1(x) $ 를 분포함수로 갖는 이산확률변수이고, $ X_2 $ 는 $ F_2(x) $ 를 분포함수로 갖는 연속확률변수이다.
기댓값을 구할 수 있기 때문에 분산 역시 구할 수 있다.