[R] 단일변수 탐색적 자료 분석(EDA)
·
Language/R
기본적 자료 분석 기본적으로 확인할 것은 데이터의 자료형(data type)이다. 이는 보통 class 혹은 mode 함수로 확인한다. class 는 데이터 자체의 자료형을 반환하고, mode 는 데이터 내부의 자료형을 반환한다. 예를 들어 어떤 매트릭스 변수에 숫자 데이터가 들어있다면, class 를 통해서 변수를 확인할 때는 matrix 와 array 를 반환하지만, mode 를 통해서 확인하면 numeric 을 반환한다. 단, 벡터 변수의 경우 class 로 확인해도 vector 를 반환하는 것이 아니라 내부 데이터 자료형을 반환한다. 범주형 자료 질적 자료(참고 링크)라고도 불린다. 기본적으로 누적 도수(참고 링크)를 통해 비율을 구한 후 이 비율을 분석한다. 아래와 같은 기본적인 데이터를 가정하..