[ML] 주성분 분석(PCA)과 선형판별분석(LDA)을 통한 차원 축소(dimensionality reduction)
·
Artificial Intelligence/Machine Learning
주성분 분석 (PCA, principal component analysis) 데이터의 피처(feature)가 굉장히 많은 경우를 생각해보자. 피처가 적을 때보다 계산 비용이 증가하고, 불필요한 피처가 있는 경우 심지어 일반화 성능은 더 나빠질 수 있다. 또한 차원의 저주(curse of dimensionality)를 생각하면 가능한 유용한 정보만을 남기는 방향, 즉 피처를 줄이는 것이 바람직하다. 그렇다고 단순한 피처 선택(feature selection)으로 일부 피처를 제거하는 것은 결국 정보를 제거하는 것이기에 정말 쓸모없는 피처가 아닌 이상 바람직하지 않다.이와 같은 문제점을 보완하기 위해 차원 축소 기법이 활용된다. 차원 축소는 말 그대로 데이터의 차원을 줄여 압축하는 방법이다. 예를 들어 3차..