Statistics/Mathematical Statistics

[Mathematical Statistics] 위치-크기 변환(location-scale transformation)
·
Statistics/Mathematical Statistics
위치-크기 변환 (Location-Scale Transformation) $ X $ 가 확률변수이고, $ Y = \sigma X + \mu $ 라 하자. $ \sigma > 0 $ 와 $ \mu $는 상수이다. 이때 $ Y $ 는 $ X $ 를 위치-크기 변환하여 얻어졌다고 말한다. 여기서 $ \mu $ 는 위치 변화를, $ \sigma $ 는 크기 변화를 조절한다.이 기법은 이산확률변수에는 적용 불가능하며, 확률밀도함수(PDF)가 아니라 확률변수 자체에 적용해야 한다. 연속균등분포에 적용 이를 연속균등분포에 적용하여 볼 수 있다.$ X \sim U (a, b) $ 이라 하면 변환 $ Y = \sigma X + \mu $ 는 균등성(uniformity)을 보존한다. 즉 다음과 같다.$$ Y \sim U ..
[Mathematical Statistics] 연속균등분포(continuous uniform distribution)
·
Statistics/Mathematical Statistics
연속균등분포 (Continuous Uniform Distribution) 실수 $ a $ 에서 $ b $ 사이의 값을 선택할 확률이 동일할 때, $ a $ 에서 $ b $ 사이 선택 값을 확률변수 $ X $ 라 하면, 확률변수 $ X $ 는 연속균등분포를 따른다고 한다.$ X \sim U(a, b) $      or      $ X \sim \text{Unif}(a, b) $확률변수 $ X $ 가 $ a $ 에서 $ b $ 까지의 실수를 선택하는 연속균등분포를 따를 때 위와 같이 나타낸다. 이산적이지 않고, 연속적으로 확률변수 값이 나타나기 때문에 연속확률분포이다.연속균등분포가 중요한 이유는 임의의 분포함수 $ F(y) $ 를 따르는 확률변수 $ Y $ 의 관측값 집합을 구할 때, 연속균등분포를 따르는 ..
[Mathematical Statistics] 푸아송분포(Poisson distribution)
·
Statistics/Mathematical Statistics
푸아송분포 (Poisson Distribution) 어떤 시공간 혹은 명시된 영역에서 사건이 평균적으로 $ \lambda $ 번 발생할 때, 사건이 발생할 횟수를 확률변수 $ X $ 라 하면, 확률변수 $ X $ 가 푸아송분포를 따른다고 한다. 포아송이라고도 한다.$$  X \sim Po(\lambda) $$확률변수 $ X $ 가 평균적으로 벌어지는 사건 횟수가 $ \lambda $ 인 푸아송분포를 따를 때 위와 같이 나타낸다. 이때 각 구간에서 벌어지는 사건이 독립적이고, 일정해야 하며, 가능한 희소한 사건이어야 푸아송분포로 확인하는 것이 의미가 있다. 만약 독립적이지 않고, 일정하지 않다면 푸아송분포를 사용하지 못하며, 희소한 사건이 아니라면 푸아송분포를 사용하는 의미가 퇴색된다.특징을 생각해본다면 ..
[Mathematical Statistics] 이산균등분포(discrete uniform distribution)
·
Statistics/Mathematical Statistics
이산균등분표 (Discrete Uniform Distribution) 유한하고 공집합이 아닌 수들의 집합 $ C $ 에서 하나의 원소를 선택할 확률이 동일할 때, 선택 값을 확률변수 $ X $ 라 하면, 확률변수 $ X $ 가 이산균등분포를 따른다고 한다.$$ X \sim \text{DUnif}(n) $$확률변수 $ X $ 가 $ 1 $ 에서 $ n $ 까지의 자연수 하나를 선택하는 이산균등분포를 따를 때 위와 같이 나타낸다. 주로 $ 1 $ 에서 $ n $ 까지 나타내기 때문에 위와 같이 나타내는 것이지, 범위가 $ a $ 에서 $ b $ 까지라면, $ X \sim \text{DUnif}(a, b) $ 와 같이 나타내기도 한다. 이산균등분포의 성질 $ X \sim \text{DUnif}(n) $ 일 때..
[Mathematical Statistics] 초기하분포(hypergeometric distribution)
·
Statistics/Mathematical Statistics
초기하분포 (Hypergeometric Distribution) 크기가 $ N $ 인 모집단에 $ r $ 개의 관심집단이 포함되어 있고, 여기서 $ n $ 개의 표본을 비복원추출하였을 때, 표본에서 관심집단의 수를 확률변수 $ X $ 라 하면, 확률변수 $ X $ 가 초기하분포를 따른다고 한다. $ X \sim H(N, n, r) $      or      $ X \sim \text{HGeom}(N, n, r) $확률변수 $ X $ 가 모집단 크기가 $ N $, 모집단 내 관심집단의 크기가 $ r $, 표본의 크기가 $ n $ 인 초기하분포를 따를 때 위와 같이 나타낸다. 단 누구는 모집단의 크기 대신 모집단에서 관심집단의 크기를 제외한 크기, 즉 $ N - r $ 을 사용하기도 하며, $ N $, $ ..
[Mathematical Statistics] 표시확률변수와 근본가교
·
Statistics/Mathematical Statistics
표시확률변수 (Indicator Random Variables) 표시확률변수는 사건이 발생하면 1, 발생하지 않으면 0 을 갖는 확률변수이다. 즉 다음과 같다.$$ I_A = \begin{cases} 1 & \text{Event A occurs} \\ 0 & \text{Event A does not occur} \end{cases} $$또한 사건 $ A $ 와 $ B $ 가 다음에 대해 성립한다.$$ (I_A)^k = I_A \quad k \in \mathbb{Z}^+ $$$$ I_{A^C} = 1-I_A $$$$ I_{A \cap B} = I_A I_B $$$$ I_{A \cup B} = I_A + I_B - I_A I_B $$표시확률변수가 0 또는 1 의 값을 가진다는 것을 생각하면 위의 성질이 성립..
[Mathematical Statistics] 기하분포(geometric distribution)와 음이항분포(negative binomial distribution)
·
Statistics/Mathematical Statistics
기하분포 (Geometric Distribution) 성공확률이 $ p $ 인 베르누이 시행을 반복할 때, 즉 이항실험을 할 때 처음 성공할 때까지 시행 횟수를 확률변수 $ X $ 라 하면, 확률변수 $ X $ 가 기하분포를 따른다고 한다.$$ X \sim \text{Geom}(p) $$확률변수 $ X $ 가 성공확률이 $ p $ 인 기하분포를 따를 때 위와 같이 나타낸다. 일반적으로는 성공까지 시도한 횟수를 기준으로 기하분포를 말하지만, 처음 성공할 때 까지 실패한 횟수로 기하분포를 말하기도 하기 때문에 주의가 필요하다. 이항분포와 마찬가지로 이산확률분포이다.지수분포와 같이 대표적인 무기억분포(memoryless distribution)인데, 무기억분포란 현재 상태에서 미래의 결과가 과거의 결과와 무관..
[Mathematical Statistics] 베르누이분포(Bernoulli distribution)와 이항분포(binomial distribution)
·
Statistics/Mathematical Statistics
베르누이분포 (Bernoulli Distribution) 베르누이 시행 (Bernoulli Tria)시행 시 두 개의 결과, 즉 성공과 실패만 존재하는 시행이다. 시행에서 성공확률은 $ p $ 로 일정하다. 베르누이분포$ X \sim \text{Bern}(p) $      or      $ X \sim \text{Bernoulli}(p) $베르누이 시행의 분포를 말한다. 확률변수 $ X $ 가 성공확률이 $ p $ 인 베르누이분포를 따르는 경우 위와 같이 나타낸다. 실패 확률 $ 1-p $ 를 $ q $ 로 나타내기도 한다. 베르누이 시행이 이산적이기 때문에 당연히 $ X $ 는 이산확률변수이며 베르누이분포는 이산확률분포이다. 베르누이분포의 성질 $ X \sim \text{Bernoulli}(p) $ 일..
[Mathematical Statistics] 확률생성함수(PGF)
·
Statistics/Mathematical Statistics
확률생성함수 (Probability Generating Function, PGF) 적률생성함수와 유사한 함수로 확률변수가 이산확률변수이고 기댓값이 존재할 때 해당 확률변수의 확률생성함수가 존재한다고 말하며 다음과 같이 정의한다.$$ G_X(t) = E\left(t^X\right) = \sum_{i=0}^\infty t^i p(i) $$그리고 아래와 같이 전개 가능하다.$$ G_X(t) = p_0 + p_1t + p_2t^2 + \cdots $$따라서 $ G_X(t) $ 를 알고 있고, 전개 가능하다면 $ t^x $ 의 계수로서 $ p(x) $ 를 구할 수 있다. 또한 $ G_X(t) $ 를 반복적으로 미분하면 확률변수 $ X $ 에 대한 계승적률(factorial moment)을 구할 수 있다.확률생성함..
[Mathematical Statistics] 적률(moment)과 적률생성함수(MGF)
·
Statistics/Mathematical Statistics
왜도와 첨도 왜도와 첨도는 확률분포의 기울어짐과 꼬리 두께에 관한 측도이다. 여기(링크)를 참고하여 대강의 개념을 알면 좋다. 왜도 (Skewness)$$ \gamma_1 = \dfrac{E\left[ (X-\mu)^3\right]}{\sigma^3} $$$ \gamma_1 $ 혹은 $ S_k $ 로 표기한다.첨도 (Kurtosis)$$ \gamma_2 = \dfrac{E\left[(X-\mu)^4\right]}{\sigma^4} $$$ \gamma_2 $ 혹은 $ K $ 로 표기한다. 표준정규분포의 첨도가 3 이기 때문에 위 첨도 값에서 3 을 빼서 사용하기도 하며, 이때의 첨도를 초과 첨도라 한다. 적률 (Moment) 원래 '적률'은 수학에서의 용어인데, 통계학에서 빌려와 사용한다. 따라서 '적률'..
애스터로이드
'Statistics/Mathematical Statistics' 카테고리의 글 목록 (2 Page)