표시확률변수 (Indicator Random Variables)
표시확률변수는 사건이 발생하면 1, 발생하지 않으면 0 을 갖는 확률변수이다. 즉 다음과 같다.
$$ I_A = \begin{cases} 1 & \text{Event A occurs} \\ 0 & \text{Event A does not occur} \end{cases} $$
또한 사건 $ A $ 와 $ B $ 가 다음에 대해 성립한다.
$$ (I_A)^k = I_A \quad k \in \mathbb{Z}^+ $$
$$ I_{A^C} = 1-I_A $$
$$ I_{A \cap B} = I_A I_B $$
$$ I_{A \cup B} = I_A + I_B - I_A I_B $$
표시확률변수가 0 또는 1 의 값을 가진다는 것을 생각하면 위의 성질이 성립하는 것은 쉽게 증명된다.
표시확률변수는 지시확률변수라고도 한다.
근본가교 (Fundamental Bridge)
표시확률변수가 확률과 기댓값 사이를 연결하는데, 이를 근본가교라 한다.
사건과 표시확률변수는 일대일 대응 관계에 있으며 어떤 사건의 확률은 그 사건의 표시확률변수의 기댓값이다. 즉 다음과 같다.
$$ P(A) = E(I_A) $$
어떤 사건 $ A $ 에 대한 표시확률변수를 $ I_A $ 라 가정하자. $ A $ 는 유일한 $ I_A $ 를 결정하며 그 역인 $ I_A $ 가 유일한 $ A $ 를 결정한다는 것 역시 성립한다. 이때 $ I_A $ 에서 역으로 $ A $ 로 가려면, $ A = \{ s \in S \mid I_A(s) = 1 \} $ 를 이용할 수 있다. 표시확률변수의 성질을 생각해본다면 $ I_A \sim \text{Bern}(p) $ 이고, 여기서 $ p = P(A) $ 이다. 따라서 $ E(I_A) = 1 \dot P(A) + 0 \dot (1-P(A)) $ 이고, $ E(I_A) = P(A) $ 이다.
이 근본가교는 복잡한 확률 문제를 표시확률변수로 표현하고, 기대값을 통해 쉽게 계산할 수 있도록 돕는다. 예를 들어 이항분포의 기댓값을 계산하는 것을 다음과 같이 나타낼 수 있다. $ X \sim B(n, p) $ 라 가정하자.
$$ X = I_1 + I_2 + \cdots + I_n $$
$$ E(X) = E(I_1 + I_2 + \cdots + I_n) $$
$$ = E(I_1) + E(I_2) + \cdots + E(I_n) $$
$$ = \underbrace{p + p + \cdots + p}_{n} = np $$
즉 다음이 성립한다.
$$ E\left[ \sum_{i=1}^n I_i \right] = \sum_{i=1}^n E(I_i) = np $$
'Statistics > Mathematical Statistics' 카테고리의 다른 글
표시확률변수 (Indicator Random Variables)
표시확률변수는 사건이 발생하면 1, 발생하지 않으면 0 을 갖는 확률변수이다. 즉 다음과 같다.
IA={1Event A occurs0Event A does not occur
또한 사건 A 와 B 가 다음에 대해 성립한다.
(IA)k=IAk∈Z+
IAC=1−IA
IA∩B=IAIB
IA∪B=IA+IB−IAIB
표시확률변수가 0 또는 1 의 값을 가진다는 것을 생각하면 위의 성질이 성립하는 것은 쉽게 증명된다.
표시확률변수는 지시확률변수라고도 한다.
근본가교 (Fundamental Bridge)
표시확률변수가 확률과 기댓값 사이를 연결하는데, 이를 근본가교라 한다.
사건과 표시확률변수는 일대일 대응 관계에 있으며 어떤 사건의 확률은 그 사건의 표시확률변수의 기댓값이다. 즉 다음과 같다.
P(A)=E(IA)
어떤 사건 A 에 대한 표시확률변수를 IA 라 가정하자. A 는 유일한 IA 를 결정하며 그 역인 IA 가 유일한 A 를 결정한다는 것 역시 성립한다. 이때 IA 에서 역으로 A 로 가려면, A={s∈S∣IA(s)=1} 를 이용할 수 있다. 표시확률변수의 성질을 생각해본다면 IA∼Bern(p) 이고, 여기서 p=P(A) 이다. 따라서 E(IA)=1˙P(A)+0˙(1−P(A)) 이고, E(IA)=P(A) 이다.
이 근본가교는 복잡한 확률 문제를 표시확률변수로 표현하고, 기대값을 통해 쉽게 계산할 수 있도록 돕는다. 예를 들어 이항분포의 기댓값을 계산하는 것을 다음과 같이 나타낼 수 있다. X∼B(n,p) 라 가정하자.
X=I1+I2+⋯+In
E(X)=E(I1+I2+⋯+In)
=E(I1)+E(I2)+⋯+E(In)
=p+p+⋯+p⏟n=np
즉 다음이 성립한다.
E[n∑i=1Ii]=n∑i=1E(Ii)=np