GMM1 GMM (Gaussian Mixture Models) 📚 GMM ✅ 개요 • KNN, 위계적 군집화, DBSCAN 등의 알고리즘은 벡터간 유사도로 군집화를 실시한다. 반면 GMM은 관측된 데이터가 특정 확률 분포를 이용해서 생성되었다고 가정하는 확률 모델이다. • GMM은 독립변수에 대한 다변량 분포(multivariate distribution)를 사용해서 데이터가 생성되었다고 가정한다. 하나의 분포가 하나의 군집을 의미하고, 다변량 분포에서는 여러 개의 확률 분포(=여러 개의 피쳐)를 사용한다. GMM에서는 각 분포가 가우시안 분포(=정규 분포)를 따른다. ✅ 정규 분포 (= 가우시안 분포) 독립변수가 하나인 경우 정규분포는 아래와 pdf를 따른다. 정규분포의 주요 파라미터는 평균과 분산이고 아래와 같이 표현할 수 있다. 독립변수가 1개인 데이터가 있을.. 2022. 6. 18. 이전 1 다음