푸아송분포 (Poisson Distribution)
어떤 시공간 혹은 명시된 영역에서 사건이 평균적으로 $ \lambda $ 번 발생할 때, 사건이 발생할 횟수를 확률변수 $ X $ 라 하면, 확률변수 $ X $ 가 푸아송분포를 따른다고 한다. 포아송이라고도 한다.
$$ X \sim Po(\lambda) $$
확률변수 $ X $ 가 평균적으로 벌어지는 사건 횟수가 $ \lambda $ 인 푸아송분포를 따를 때 위와 같이 나타낸다. 이때 각 구간에서 벌어지는 사건이 독립적이고, 일정해야 하며, 가능한 희소한 사건이어야 푸아송분포로 확인하는 것이 의미가 있다. 만약 독립적이지 않고, 일정하지 않다면 푸아송분포를 사용하지 못하며, 희소한 사건이 아니라면 푸아송분포를 사용하는 의미가 퇴색된다.
특징을 생각해본다면 어떤 이항분포를 따르는 확률변수가 있을 때, 시행 횟수인 $ n $ 이 아주 크고, 성공 확률 $ p $ 가 아주 작다면 푸아송분포로 근사 가능하리라 생각할 수 있다. 결국 푸아송분포를 따르는 확률변수는 이항실험으로 이루어졌기 때문이다.
기하분포, 지수분포와 같이 무기억성분포이다. 겹치지 않는 부분 구간들에서 발생하는 사건의 수가 독립이기 때문이다.
푸아송분포의 성질
$ X \sim Po(\lambda) $ 일 때 다음이 성립한다.
- 확률질량함수
$$ p_X(x) = \dfrac{\lambda^x e^{-\lambda}}{x!} $$
이항분포의 $ n $ 이 매우 클 때 푸아송분포로 근사하는 것은 다음과 같다.
$ \lim_{n \to \infty} \binom{n}{x} p^x (1-p)^{n-x} = \dfrac{\lambda^x e^{-\lambda}}{x!} $
- 기댓값
$$ E(X) = \lambda $$
잘 생각해본다면 이미 기댓값을 $ \lambda $ 로 설정한 것이 푸아송분포이다.
- 표준편차
$$ \sigma_X = \sqrt{\lambda} $$
$ E(X^2) = \sum_{x=0}^\infty x^2 \dfrac{\lambda^x e^{-\lambda}}{x!} $
$ = \sum_{x=0}^\infty x (x-1) \dfrac{\lambda^x e^{-\lambda}}{x!} + \sum_{x=0}^\infty x \dfrac{\lambda^x e^{-\lambda}}{x!} $
$ \sum_{x=0}^\infty x (x-1) \dfrac{\lambda^x e^{-\lambda}}{x!} = \lambda^2 e^{-\lambda} \sum_{x=2}^\infty \dfrac{\lambda^{x-2}}{(x-2)!} = \lambda^2 $
$ \therefore E(X^2) = \lambda^2 + \lambda $
$ V(X) = E(X^2) - (E(X))^2 = \lambda^2 + \lambda - \lambda^2 = \lambda $
- 적률생성함수 (MGF)
$$ M_X(t) = e^{\lambda\left(e^t-1\right)} $$
$ M_X(t) = \sum_{x=0}^\infty e^{tx} \dfrac{\lambda^x e^{-\lambda}}{x!} $
$ = \sum_{x=0}^\infty \dfrac{(\lambda e^t)^x e^{-\lambda}}{x!} $
$ = e^{-\lambda} \sum_{x=0}^\infty \dfrac{(\lambda e^t)^x}{x!} $
이때 $ \sum_{x=0}^\infty \dfrac{(\lambda e^t)^x }{x!} = e^{\lambda e^t} $ 이다.
$ M_X(t) = e^{-\lambda} e^{\lambda e^t} \sum_{x=0}^\infty \dfrac{(\lambda e^t)^x e^{-\lambda e^t}}{x!} $
$ = e^{-\lambda} e^{\lambda e^t} = e^{\lambda\left(e^t-1\right)} $
$ \sum_{x=0}^\infty \dfrac{(\lambda e^t)^x e^{-\lambda e^t}}{x!} $ 은 푸아송확률변수의 확률함수의 합이고 따라서 1 이다.
'Statistics > Mathematical Statistics' 카테고리의 다른 글
[Mathematical Statistics] 위치-크기 변환(location-scale transformation) (0) | 2024.10.13 |
---|---|
[Mathematical Statistics] 연속균등분포(continuous uniform distribution) (0) | 2024.10.13 |
[Mathematical Statistics] 이산균등분포(discrete uniform distribution) (0) | 2024.10.10 |
[Mathematical Statistics] 초기하분포(hypergeometric distribution) (0) | 2024.10.10 |
[Mathematical Statistics] 표시확률변수와 근본가교 (0) | 2024.10.10 |