전체 글

[Mathematical Statistics] 초기하분포(hypergeometric distribution)
·
Statistics/Mathematical Statistics
초기하분포 (Hypergeometric Distribution) 크기가 $ N $ 인 모집단에 $ r $ 개의 관심집단이 포함되어 있고, 여기서 $ n $ 개의 표본을 비복원추출하였을 때, 표본에서 관심집단의 수를 확률변수 $ X $ 라 하면, 확률변수 $ X $ 가 초기하분포를 따른다고 한다. $ X \sim H(N, n, r) $      or      $ X \sim \text{HGeom}(N, n, r) $확률변수 $ X $ 가 모집단 크기가 $ N $, 모집단 내 관심집단의 크기가 $ r $, 표본의 크기가 $ n $ 인 초기하분포를 따를 때 위와 같이 나타낸다. 단 누구는 모집단의 크기 대신 모집단에서 관심집단의 크기를 제외한 크기, 즉 $ N - r $ 을 사용하기도 하며, $ N $, $ ..
[Mathematical Statistics] 표시확률변수와 근본가교
·
Statistics/Mathematical Statistics
표시확률변수 (Indicator Random Variables) 표시확률변수는 사건이 발생하면 $1$, 발생하지 않으면 $0$ 을 갖는 확률변수이다. 즉 다음과 같다.$$ I_A = \begin{cases} 1 & \text{Event A occurs} \\ 0 & \text{Event A does not occur} \end{cases} $$또한 사건 $ A $ 와 $ B $ 가 다음에 대해 성립한다.$$ (I_A)^k = I_A \quad k \in \mathbb{Z}^+ $$$$ I_{A^C} = 1-I_A $$$$ I_{A \cap B} = I_A I_B $$$$ I_{A \cup B} = I_A + I_B - I_A I_B $$표시확률변수가 $0$ 또는 $1$ 의 값을 가진다는 것을 생각하면 위..
[Mathematical Statistics] 기하분포(geometric distribution)와 음이항분포(negative binomial distribution)
·
Statistics/Mathematical Statistics
기하분포 (Geometric Distribution) 성공확률이 $ p $ 인 베르누이 시행을 반복할 때, 즉 이항실험을 할 때 처음 성공할 때까지 시행 횟수를 확률변수 $ X $ 라 하면, 확률변수 $ X $ 가 기하분포를 따른다고 한다.$$ X \sim \text{Geom}(p) $$확률변수 $ X $ 가 성공확률이 $ p $ 인 기하분포를 따를 때 위와 같이 나타낸다. 일반적으로는 성공까지 시도한 횟수를 기준으로 기하분포를 말하지만, 처음 성공할 때 까지 실패한 횟수로 기하분포를 말하기도 하기 때문에 주의가 필요하다. 이항분포와 마찬가지로 이산확률분포이다.지수분포와 같이 대표적인 무기억분포(memoryless distribution)인데, 무기억분포란 현재 상태에서 미래의 결과가 과거의 결과와 무관..
[Mathematical Statistics] 베르누이분포(Bernoulli distribution)와 이항분포(binomial distribution)
·
Statistics/Mathematical Statistics
베르누이분포 (Bernoulli Distribution) 베르누이 시행 (Bernoulli Tria)시행 시 두 개의 결과, 즉 성공과 실패만 존재하는 시행이다. 시행에서 성공확률은 $ p $ 로 일정하다. 베르누이분포$ X \sim \text{Bern}(p) $      or      $ X \sim \text{Bernoulli}(p) $베르누이 시행의 분포를 말한다. 확률변수 $ X $ 가 성공확률이 $ p $ 인 베르누이분포를 따르는 경우 위와 같이 나타낸다. 실패 확률 $ 1-p $ 를 $ q $ 로 나타내기도 한다. 베르누이 시행이 이산적이기 때문에 당연히 $ X $ 는 이산확률변수이며 베르누이분포는 이산확률분포이다. 베르누이분포의 성질 $ X \sim \text{Bernoulli}(p) $ 일..
[Mathematical Statistics] 확률생성함수(PGF)
·
Statistics/Mathematical Statistics
확률생성함수 (Probability Generating Function, PGF) 적률생성함수와 유사한 함수로 확률변수가 이산확률변수이고 기댓값이 존재할 때 해당 확률변수의 확률생성함수가 존재한다고 말하며 다음과 같이 정의한다.$$ G_X(t) = E\left(t^X\right) = \sum_{i=0}^\infty t^i p(i) $$그리고 아래와 같이 전개 가능하다.$$ G_X(t) = p_0 + p_1t + p_2t^2 + \cdots $$따라서 $ G_X(t) $ 를 알고 있고, 전개 가능하다면 $ t^x $ 의 계수로서 $ p(x) $ 를 구할 수 있다. 또한 $ G_X(t) $ 를 반복적으로 미분하면 확률변수 $ X $ 에 대한 계승적률(factorial moment)을 구할 수 있다.확률생성함..
[Inferential Statistics] 독립항등분포 i.i.d.
·
Statistics/Inferential Statistics
독립항등분포 (Independent and Identically Distributed) 통계학에서 자주 i.i.d.로 표기되는 독립항등분포는 이항분포처럼 특정 분포를 나타내는 것이 아니라 하나의 가정이다. 이름에서 드러나듯이 각 확률변수들이 상호 독립적이고, 동일한 확률분포를 따른다는 가정을 말한다.상호 독립적(independent)이란 말은 각 확률변수가 다른 확률변수에 영향을 주지 않는다는 뜻이다. 예를 들어 게임에서 팀을 선택하는데, 처음 사람이 팀을 선택할 때 그 사람의 실력과 어느 팀을 선택하는지가 공개되어 있다면, 그 후 사람들의 선택에 첫 사람의 선택이 영향을 끼치기 때문에 독립적이지 않은 것이다.동일한 확률분포(indentically distributed)를 따른다는 말은 같은 모집단에서 ..
[Data Structure] 스택(stack)
·
Computer Science and Engineering/Data Structure
스택  스택이란 스택은 후입선출(LIFO, Last In First Out) 방식으로 동작하는 자료구조이다. 즉 마지막에 삽입된 데이터가 가장 먼저 삭제된다는 뜻이다. 무엇인가를 쌓고 나서 치우려고 하면 가장 나중에 쌓은 것인 가장 위부터 치워야 하는 것과 같다. 웹 브라우저의 뒤로 가기 기능이나 프로그램에서 괄호가 제대로 열고 닫혔는지 검사할 때 사용되기도 한다.이러한 성질 때문에 스택은 가장 상위 데이터에만 접근할 수 있다. 상위 데이터를 삭제하거나, 확인하는 것은 가능하지만, 그 아래 데이터에 접근하려면 상위 데이터를 제거해 나가면서 접근해야 한다. 최상위 데이터에만 접근할 수 있다는 것은 최상위 데이터만 관리하면 된다는 뜻이기에 데이터를 관리하는 데에 드는 자원을 적게 소모한다는 뜻이기도 하다. ..
[Mathematical Statistics] 적률(moment)과 적률생성함수(MGF)
·
Statistics/Mathematical Statistics
왜도와 첨도 왜도와 첨도는 확률분포의 기울어짐과 꼬리 두께에 관한 측도이다. 여기(링크)를 참고하여 대강의 개념을 알면 좋다. 왜도 (Skewness)$$ \gamma_1 = \dfrac{E\left[ (X-\mu)^3\right]}{\sigma^3} $$$ \gamma_1 $ 혹은 $ S_k $ 로 표기한다.첨도 (Kurtosis)$$ \gamma_2 = \dfrac{E\left[(X-\mu)^4\right]}{\sigma^4} $$$ \gamma_2 $ 혹은 $ K $ 로 표기한다. 표준정규분포의 첨도가 3 이기 때문에 위 첨도 값에서 3 을 빼서 사용하기도 하며, 이때의 첨도를 초과 첨도라 한다. 적률 (Moment) 원래 '적률'은 수학에서의 용어인데, 통계학에서 빌려와 사용한다. 따라서 '적률'..
[Discrete Mathematics] 수열(sequence)과 문자열(string)
·
Mathematics/Discrete Mathematics
수열 (Sequence) 수열 $ s $ 는 정의역 $ D $ 가 정수의 부분집합인 함수이다. $ s(n) $ 대신 $ s_n $ 표기법을 사용하며, 이때 $ n $ 을 수열의 인덱스(index)라 한다. $ D $ 가 유한 집합인 수열을 유한 수열, 그렇지 않으면 무한 수열이라 한다. 수열은 $ s $ 으로 표기하고, 수열의 단일 원소는 인덱스를 붙여 $ s_n $ 으로 나타낸다.무한 수열은 다음과 같은 수열을 고려해 확인해볼 수 있다. 수열 $ s : 2, 4, 6, \dots , 2n , \dots $ 을 고려하면 $ n $ 번째 원소는 $ 2n $ 이다. 만약 정의역이 양의 정수 집합 $ \mathbb{Z}^+ $ 라면 $ s_1 = 2, s_2 = 4, \dots , s_n = 2n, \dots..
[Discrete Mathematics] 함수(function)의 정의와 성질을 통한 분류
·
Mathematics/Discrete Mathematics
함수의 정의 함수는 어떤 집합의 각 원소를 다른 어떤 집합의 각 원소에 유일하게 대응시키는 관계를 말한다. 예를 들어 $ X $ 와 $ Y $ 가 집합일 때 $ X $ 에서 $ Y $ 로의 함수 $ f $ 는 $ f : X \to Y $ 로 나타낸다. 이는 카테시안 곱 $ X \times Y $ 의 부분집합으로 정의되며 카테시안 곱은 $ \{ (x,y) \mid x \in X, y \in Y \} $ 이다. 각 $ x \in X $ 에 대해 정확히 하나의 $ y \in Y $ 가 존재하여 $ (x,y) \in f $ 를 만족하는 성질을 가진다. 이를 $ f(x) = y $ 라 표기한다.이때 집합 $ X $ 를 정의역(domain)이라 하고, 집합 $ Y $ 를 공역(codomain)이라 한다. $ f $..
애스터로이드
인공지능은 전기양의 꿈을 꾸는가