추론통계학

[Inferential Statistics] 대표본, 소표본에서의 신뢰구간 설정 및 모분산의 신뢰구간
·
Statistics/Inferential Statistics
대표본에서의 신뢰구간 대표본이라는 것은 중심극한정리(CLT)를 적용 가능하다는 의미이다. 중심극한정리에 따라 $ \theta $ 의 목표모수가 $ \mu $, $p$, $\mu_1 - \mu_2 $ 또는 $ p_1 - p_2 $ 라면 추축량 $ Z $ 는 다음과 같고 근사적으로 표준정규분포를 따른다.$$ Z = \dfrac{\hat{\theta} - \theta}{\sigma_\hat{\theta}} \sim N (0, 1) $$근사적으로 추축량이 되므로 목표모수에 대한 신뢰구간 계산에 추축법을 사용할 수 있다. 목표모수 종류에 따른 표준오차는 다음과 같다.목표모수 $ \theta $점추정량 $ \hat{\theta} $표준오차 $ \sigma_\hat{\theta} $모평균 $ \mu $$$ \bar{..
[Inferential Statistics] 신뢰구간(CI, confidence interval)
·
Statistics/Inferential Statistics
신뢰구간 (CI, Confidence Interval) 신뢰구간은 구간추정량(interval estimator)을 말하는데, 좀 더 정확히 말하자면 표본 측정값을 사용하여 구간의 양 끝점을 게산하는 방법을 규정하는 규칙이다. 신뢰구간이 의미있기 위해서는 당연하게도 신뢰구간은 목표모수 $ \theta $ 를 포함할 가능성이 높아야 하며, 가능한 범위가 좁아야 한다.이렇게 설정된 신뢰구간의 위와 아래의 끝점을 각각 신뢰상한(upper confidence)과 신뢰하한(lower confidence)라 한다. 그리고 신뢰구간이 목표모수 $ \theta $ 를 포함할 확률을 신뢰계수(confidence coefficient) 혹은 신뢰수준(confidence level)이라 한다. 여기서 목표모수를 포함한다는 것..
[Inferential Statistics] 추정오차(error of estimation)
·
Statistics/Inferential Statistics
추정오차 (Error of Estimation) 추정오차 $ \epsilon $ 은 추정량과 목표모수와의 거리이다. 즉 다음과 같다.$$ \epsilon = | \hat{\theta} - \theta | $$추정오차를 통해 점추정 절차의 우수성을 측정할 수 있고, 당연히 추정오차가 작을수록 선호된다.이때 $ \hat{\theta} $ 가 확률변수이므로 $ \epsilon $ 역시 확률적 양이다. 따라서 측정 추정값에 대하여 얼마나 크고 작은지를 말할 수 없고, 다만 확률적 주장만 가능하다. 즉 다음과 같이 나타낼 수 있다.$$ P( \epsilon 만약 $ b $ 가 현실적 관점에서 작다고 간주할 수 있다면 당연히 $ P( \epsilon 반대로 $ P(\epsilon $$ \int_{\theta - b..
[Inferential Statistics] 점추정량의 불편성(unbiasedness)
·
Statistics/Inferential Statistics
편향 (Bias) 편향은 추정량이 실제 모수와 얼마나 차이가 있는가를 나타내는 척도로 정확히는 추정량의 기댓값과 실제 모수의 차이를 말한다. 즉 모수를 $ \theta $ 라 하고, 추정량을 $ \hat{\theta} $ 라 할 때 추정량의 편향 $ B(\hat{\theta}) $ 는 다음과 같다.$$ B (\hat{\theta} ) = E(\hat{\theta}) - \theta $$당연히도 편향은 모수 추정에 유리하도록 작을수록 좋다.참고로 추정량의 평균제곱오차는 $ \operatorname{MSE}(\hat{\theta}) = E \left[ (\hat{\theta} - \theta)^2 \right] $ 인데, 이는 다시 쓰면 $ \operatorname{MSE}(\hat{\theta}) = V(..
[Inferential Statistics] 추정(estimate) 및 추정량(estimator)
·
Statistics/Inferential Statistics
추정 (Estimate) 통계학의 가장 큰 목적 중 하나는 표본을 통해 모집단을 추정하는 것이다. 모집단을 추정하는 것은 모집단의 특징에 관심을 갖는 것인데, 이러한 모집단의 특징을 모수(parameter)라 하고, 관심이 있는 모수를 목표모수(target parameter)라 한다. 목표모수를 알기 위해 표본을 추출하고 표본 데이터로부터 모수의 값을 추측하는 절차를 통계적 추정(statistical estimation)이라 한다.이러한 추정에는 두 가지 다른 형태가 있다. 하나는 점추정(point estimate)이고, 하나는 구간추정(interval estimate)이다. 점추정은 예를 들어 미지의 모평균에 가깝다고 생각되는 하나의 수치를 통해 추정하는 것이고, 구간추정은 미지의 모평균을 포함하리라 ..
[Inferential Statistics] 독립항등분포 i.i.d.
·
Statistics/Inferential Statistics
독립항등분포 (Independent and Identically Distributed) 통계학에서 자주 i.i.d.로 표기되는 독립항등분포는 이항분포처럼 특정 분포를 나타내는 것이 아니라 하나의 가정이다. 이름에서 드러나듯이 각 확률변수들이 상호 독립적이고, 동일한 확률분포를 따른다는 가정을 말한다.상호 독립적(independent)이란 말은 각 확률변수가 다른 확률변수에 영향을 주지 않는다는 뜻이다. 예를 들어 게임에서 팀을 선택하는데, 처음 사람이 팀을 선택할 때 그 사람의 실력과 어느 팀을 선택하는지가 공개되어 있다면, 그 후 사람들의 선택에 첫 사람의 선택이 영향을 끼치기 때문에 독립적이지 않은 것이다.동일한 확률분포(indentically distributed)를 따른다는 말은 같은 모집단에서 ..
애스터로이드
'추론통계학' 태그의 글 목록 (3 Page)