기술통계학

[Descriptive Statistics] 왜도(skewness)와 첨도(kurtosis)
·
Statistics/Descriptive Statistics
자료의 분포 위치측도, 중심위치측도, 산포측도는 대략적으로 자료의 대표적 성격을 보여준다. 그런데 단순히 이러한 측도들을 통해서는 자료의 비대칭성을 보일수는 없다. 자료의 분포가 좌우대칭이라는 전제가 있다면 평균과 분포만 있어도 대략적인 그림을 그릴 수 있겠지만, 그렇지 않다면 분포가 어느 방향으로 얼마나 기울어져 있는지 확인하고, 표현해야 자료의 특성을 정확히 표현할 수 있다. 왜도 (Skewness) 자료의 분포가 기울어진 정도를 의미한다. 왜도가 0 일 때 좌우대칭이며, 음수라면 오른쪽으로 긴 꼬리를 가진, 즉 왼쪽으로 치우쳐진 모양을, 양수라면 왼쪽으로 꼬리를 가진, 즉 오른쪽으로 치우쳐진 모양을 가진다. 왜도가 0 일 때가 위 그림에서 주황색, 음수일 때가 초록색, 양수일 때가 파란색 그래프이다..
[Descriptive Statistics] 대푯값 및 위치와 산포의 측도
·
Statistics/Descriptive Statistics
위치측도 (Measures of Position) 자료를 정렬했을 때의 위치를 나타내는 측도들이다. 표본 데이터에 주로 사용되기에 정렬 가능하다는 가정이 되어 있다.위치 측도 자체로는 많은 것을 알아내기 어렵지만, 위치 측도를 활용하면 데이터의 분포, 개형 등을 확인할 수 있다. $ Q_i $ | 사분위수 (Quartiles)자료를 네 개의 같은 갯수를 가진 그룹으로 나누고, 각 기준값을 위치 측도로 삼는다. 오름차순으로 정렬된 데이터의 인덱스를 $ i $, 자료의 크기를 $ n $ 이라 할 때, $ f_i = \dfrac{i-1}{n-1} $ 의 값이 0.25, 0.5, 0.75 가 되는 값이 각 사분위수가 되고, 차례대로 $ Q_1, Q_2, Q_3, $ 라 부른다. 특성상 $ Q_2 $ 는 중앙값과..
[Descriptive Statistics] 자료의 종류와 요약 및 시각화
·
Statistics/Descriptive Statistics
모집단과 표본 모집단 (Popuation)관심의 대상이 되는 모든 개체의 집합 혹은 확률모형을 말한다. 모집단을 구성하는 개체의 수가 유한할 경우 유한모집단, 무한할 경우 무한모집단이라 한다.표본 (Sample)모집단의 일부로서 실제 조사되는 대상의 집합이다. 확률변수 혹은 확률벡터들의 집합으로 이해할 수 있다.전수조사 (Census)모집단 전체를 조사하는 것이다. 단 조사비용, 시간 등의 문제와 조사과정에서 발생할 수 있는 비표본오차 증가 가능성, 조사 시간에 변화를 측정하지 못하는 문제 등이 있다.표본조사 (Sample Survey)모집단의 일부인 표본을 조사하는 것이다. 경제성, 신속성, 정확성, 필요성, 대표성, 적절성을 가지지만, 모집단을 대표하지 못하는 잘못된 표본을 조사할 경우 잘못된 통계를..
애스터로이드
'기술통계학' 태그의 글 목록