균등분포의 보편성
균등분포의 보편성은 균등분포를 균일분포라 하기도 한다는 점에서 균일분포의 보편성이라고도 하며, 분위수 변환(quantile transformation), 확률적분변환(probability integral transform), 역변환 샘플링(Inverse transform sampling), 혹은 시뮬레이션의 기본 정리(fundamental theorem of simulation)로도 설명 가능하다.
주어진 $ U(0, 1) $ 에서 원하는 모든 연속분포를 갖는 확률변수를 구축할 수 있으며 역도 성립한다.
$$ X \sim U(0, 1) \longleftrightarrow Y \sim \text{Arbitrary PDF} $$
만약 $ F $ 가 분포의 서포트 상에서 연속이고 순증가(strictly increasing)함수인 누적분포함수(CDF)라 하면, 이것은 $ (0, 1) $ 에서 $ \mathbb{R} $ 로의 함수로서 역함수 $ F^{-1} $ 의 존재를 보장한다. 그렇다면 다음이 성립한다.
$ X \sim U(0, 1) $ 이고 $ Y = F^{-1}(X) $ 라 하면 $ Y $ 는 누적분포함수(CDF) $ F $ 인 확률변수이다.
$ Y $ 를 누적분포함수(CDF)가 $ F $ 인 확률변수라 하면, $ F(Y) \sim U(0, 1) $ 이다.
즉 $ X \sim U(0, 1) $ 와 누적분포함수(CDF)로 시작하여 역누적분포함수 $ F^{-1} $ 에 $ X $ 를 대입함으로써 누적분포함수(CDF)가 $ F $ 인 확률변수를 만들 수 있다는 의미이다. 그렇기에 반대로 누적분포함수(CDF)가 $ F $ 인 확률변수 $ Y $ 로 시작하여 $ U(0, 1) $ 을 따르는 확률변수를 만들 수도 있다는 의미이다.
증명의 단순화를 위해 원하는 누적분포함수(CDF)가 존재하는 경우로 한정하여 보편성을 논의하고자 한다.
$ X \sim U(0, 1) $ 이고 $ Y = F^{-1}(X) $ $ (y \in R) $ 에 대하여 다음이 성립한다.
$ P(Y \leq y) = P(F^{-1}(X) \leq y) = P(X \leq F(y)) $
$ \therefore P(Y \leq y) = P(X \leq F(y)) = F(y) $
즉 $ X $ 의 누적분포함수(CDF)가 $ F(y) $ 이다.
로지스틱에서의 보편성을 통한 예시
로지스틱 분포는 로지스틱 함수가 누적분포함수(CDF)가 되는 분포인데, 당연하게 누적분포함수(CDF)는 다음과 같다.
$$ F(x) = \dfrac{e^x}{1+e^x} \quad x \in \mathbb{R} $$
이제 $ Y \sim U(0, 1) $ 이라 할 때 로지스틱 확률변수를 만들어보자.
보편성 성질로부터 $ F^{Y} \sim \text{Logistic} $ 이다. 따라서 누적분포함수(CDF)의 역함수인 $ F^{-1} $ 을 구하면 다음과 같다.
$$ F^{-1}(y) = \ln \left( \dfrac{y}{1-y} \right) $$
그리고 $ y $ 대신 $ Y $ 를 대입하면 다음과 같다.
$$ F^{-1}(Y) = \ln \left( \dfrac{Y}{1-Y} \right) $$
따라서 다음이 성립한다.
$$ \ln \left( \dfrac{Y}{1-Y} \right) \sim \text{Logistic} $$
역으로 보편성의 성질에 의해 만일 $ X \sim \text{Logistic} $ 이라면 다음이 성립한다.
$$ F(X) = \dfrac{e^x}{1+e^x} \sim U(0, 1) $$