전체 글

[Linear Algebra] 벡터(vector)의 정의와 연산 및 성질 그리고 단위벡터(unit vector)
·
Mathematics/Linear Algebra
벡터 (Vector) 1차원 공간 $ \mathbb{R}^1 $, 2 차원 공간 $ \mathbb{R}^2 $, 3차원 공간 $ \mathbb{R}^3 $ 의 벡터는 기하학의 개념인 유향선분(directed line segment)으로 표현할 수 있고, 이때 유향선분의 화살표는 방향을, 길이는 크기(norm)를 나타내며, 출발점은 처음점(intial point), 종점을 끝점(termianl point)이라 한다. 크기와 방향으로 나타내는 벡터를 유클리드 벡터라 한다.만약 유클리드 벡터 $ \mathbf{x} $ 의 처음점이 $ A $ 이고 끝점이 $ B $ 라면 $ \mathbf{x} = \overrightarrow{AB} $ 로 나타내며, 크기는 $ \left\| \mathbf{x} \right\| ..
[Mathematical Statistics] 확률변수의 독립(independence)과 공분산(covariance) 및 상관계수(correlation coefficient)
·
Statistics/Mathematical Statistics
확률변수의 독립 (Independence) 두 확률변수가 상관관계가 없다면, 즉 어떤 확률변수의 값이 다른 확률변수에 영향을 주지 않는다면 두 확률변수를 독립이라 하고 다음과 같이 나타낸다. $ F $ 는 누적분포함수이다.$$ X \bot Y \Longleftrightarrow F_{X, Y}(x, y) = F_X(x) F_Y(y) $$두 이산확률변수 $ X $ 와 $ Y $ 가 다음을 만족하면 두 확률변수가 독립이라 한다.$$ p_{X, Y}(x, y) = p_X(x) p_Y(y) \qquad \forall x, y $$$$ p_{X, Y}(x \mid y) = p_X(x) \qquad \forall x, y $$만약 두 확률변수가 연속확률변수라면 다음을 만족할 때 두 확률변수가 독립이라 한다.$$ f..
[Data Structure] 덱(deque)
·
Computer Science and Engineering/Data Structure
덱  덱(deque)은 double-ended queue의 줄임말, 즉 양쪽 방향에서 삽입과 삭제가 가능한 큐이다.데이터 추가와 삭제가 전열(front)와 후열(rear) 모두에서 가능하기 때문에 스택이나 단순 큐보다 유연하게 사용 가능하다는 장점이 있다. ADT 객체 (Object)0 개 이상의 요소들로 구성된 선형 리스트연산 (Operation)create(size) ::= 최대 크기가 size 인 공백 덱을 생성한다.init() ::= 덱를 초기화한다.is_full() ::= 덱의 원소 개수가 size 와 같다면 true 를, 아니라면 false 를 반환한다.is_empty() ::= 덱이 비어있다면 true 를, 아니라면 false 를 반환한다.add_front(item) := 덱이 가득 차 있지..
[Discrete Mathematics] 약수(divisor)와 소수(prime) 그리고 최대공약수와 최소공배수
·
Mathematics/Discrete Mathematics
약수 (Divisor) 정수 $ n $ 과 $ d $ 가 $ d \neq 0 $ 일 때, $ n = dq $ 를 만족하는 정수 $ q $ 가 존재하면 $ d $ 가 $ n $ 을 나눈다(divide)고 정의한다. 이때 $ q $ 를 몫(quotient), $ d $ 를 $ n $ 의 약수 또는 인수(factor)라 한다. 만약 $ d $ 가 $ n $ 을 나누면 $ d \mid n $ 으로 표기하고, 나누지 못한다면 $ d \nmid n $ 으로 표기한다.양의 정수 $ n $ 과 $ d $ 가 $ d \mid n $ 이면 $ d \leq n $ 이다. 왜냐하면 $ d \mid n $ 이면 $ n = dq $ 인 양의 정수 $ q $ 가 존재하며 따라서 $ d \leq dq = n $ 이기 때문이다.몫-나..
[Mathematical Statistics] 결합분포(joint distribution)와 주변분포(marginal distribution) 그리고 조건부분포(conditional distribution)
·
Statistics/Mathematical Statistics
결합분포 (Joint Distribution) 확률실험의 각 결과에 한 쌍의 실수를 부여하는 확률변수가 있을 수 있다. 다르게 보면 확률변수 여러개를 결합하여 생각할 수 있다.예를 들어서 두 동전을 던졌을 때 각각 동전의 앞면의 수를 결합하여 확인할 수도 있다. 표로 확인하면 다음과 같을 것이다. $ X $01합$ Y $01/41/41/211/41/41/2합1/21/21그래프를 통해 결합분포를 본다면 아래와 같이도 나타낼 수 있다. 그래프는 위 표와 다른 분포이다.만약 결합되는 두 확률변수의 결합분포함수가 연속이라면 두 확률변수들이 공동연속(jointly continuous)이라 하고, 이 결합분포의 확률밀도함수가 존재하면 결합되는 두 확률변수를 공동연속확률변수(jointly continuous rand..
[Mathematical Statistics] 불연속함수와 혼합확률분포의 기댓값
·
Statistics/Mathematical Statistics
불연속함수의 기댓값 확률변수 $ X $ 가 연속확률변수를 따르는 듯 보이지만, 연속확률변수가 끊어져 연속이 성립하지 않는 경우가 있을 수 있다.예를 들어 확률변수 $ X $ 가 어느 생수 업체의 일간 판매량이고 다음의 확률밀도함수를 가진다고 하자.$$ f(x) = x^2 \qquad 0 \leq x \leq 2 $$이때 판매량에 대한 수익 $ g(X) $ 가 다음과 같다고 가정하자.$$ g(X) = \begin{cases} 100X & 0 \leq X \leq 1 \\ 150X & 1 그렇다면 판매량에 대한 수익이 따르는 분포는 연속적이지 않다. 이 경우 연속확률변수에 대한 기댓값 정의를 사용하여 구할 수 있다.$$ E(X) = \int_{-\infty}^\infty g(x)f(x) dx = \int_0..
[R] 데이터 파일과 사용자 정의 함수 및 변수 불러오기
·
Language/R
경로 설정 setwd 함수를 이용해서 작업 디렉토리의 경로를 설정할 수 있다.예를 들어서 C:\Users\name\Desktop 에 있는 파일을 가져오고 싶다면 다음과 같이 경로를 설정해줄 수 있다.setwd("C:/Users/name/Desktop")만약 경로 설정을 안하고자 한다면, 그냥 파일 이름으로 경로 설정을 하면 된다. 파일 읽기 및 저장 기본적으로 R 에서는 csv, txt, R 정도의 파일을 읽어올 수 있다. 그 외 파일에 대해서는 추가로 패키지를 설치하여야 한다. csv 파일파일이 csv 파일이라면 read.csv 함수를 이용하면 된다.경로가 제대로 설정되어 있고, 해당 작업 디렉토리에 temp.csv 파일이 있다면 다음과 같이 읽어와 변수에 저장할 수 있다. 이때 csv 로 읽으면 기본..
[R] 다양한 자료형(data type)과 인덱싱(indexing)
·
Language/R
단순 데이터 형식 R 에서 데이터 형식은 크게 숫자, 문자, 논리로 나뉜다.데이터 형식예시숫자numeric정수, 실수1, 2, 3, -1, 1.45, -24.8문자character문자나 문자열 (따옴표로 감싸짐)"korea", "10", "안녕"논리logical참과 거짓TRUE, FALSE (T, F도 사용 가능)특수한 경우NULL정의되어 있지 않은 값자료형도 없고 길이도 0NA결측값NaN정의가 불가능한 값sqrt(-5)Inf, -Inf양의 무한대와 음의 무한대우선순위가 있는데 특수한 경우를 제외하면 문자형 > 숫자형 > 논리형 순이다. 이는 벡터를 다룰 때 중요하다. 변수 데이터들은 이러한 단순 데이터 형식을 포함하여 다양한 데이터 형식을 이용해 변수에 저장할 수 있다.대입연산자인 x 변수의 이름은 영..
[Mathematical Statistics] 체비쇼프 부등식(Chebyshev inequality)
·
Statistics/Mathematical Statistics
체비쇼프 부등식 (Chebyshev Ineuality) 절대부등식으로 확률분포를 정확히 모를 때 해당 확률분포의 기댓값과 표준편차 값만으로 특정한 확률의 최솟값만큼은 알아낼 수 있는 부등식이다.확률분포 $ X $ 의 기댓값을 $ \mu $, 표준편차를 $ \sigma $ 라 하면 다음이 성립한다. 단 $ k $ 는 양의 상수이다.$ P(|X-\mu|이는 확률분포와 상관없이, 즉 이산확률분포이든 연속확률분포이든 성립한다.증명은 다음과 같다. 이때 $ X $ 를 연속확률변수라 가정하였다.$ V(X) = \int_{-\infty}^\infty (x - \mu)^2 f(x) dx $$ = \int_{-\infty}^{\mu -k\sigma} (x - \mu)^2 f(x) dx + \int_{\mu -k\sigm..
[Mathematical Statistics] 베타분포(beta distribution)
·
Statistics/Mathematical Statistics
베타분포 (Beta Distribution) 확률변수 $ X $ 의 밀도함수가 $ \alpha > 0 $ 와 $ \beta > 0 $ 에 대해 다음과 같다면 확률변수 $ X $ 가 베타분포를 따른다고 한다.$$ f(x) = \dfrac{x^{\alpha -1}(1-x)^{\beta-1}}{B(\alpha, \beta)} \qquad 0 \leq x \leq 1 $$더보기베타함수 $ B $ 는 다음과 같이 정의된다.$ B(\alpha, \beta) = \int_0^1 t^{\alpha-1} (1-t)^{\beta-1} dt  = \dfrac{\Gamma{\alpha}\Gamma{\beta}}{\Gamma{\alpha+\beta}} $또한 확률변수 $ X $ 가 매개변수 $ \alpha $, $ \beta ..
애스터로이드
인공지능은 전기양의 꿈을 꾸는가