KNN2 협업필터링 + KNN ◈ 협업필터링과 KNN을 함께 사용 • 특정 사용자에 대해서 예측값 가중치를 계산할 때, 가장 가까운 K명의 neighbor의 데이터만 사용하는 방식 ✔ 가정 • 취향이 비슷한 사람들은 모든 아이템에 대한 선호가 일관되게 유사하다 • 추천 대상인 사용자와 유사도가 높은 사용자일수록, 취향을 정확하게 반영할 수 있다. ✔ 이웃의 크기 결정 방식 ① KNN : 특정 사용자와 최대한 유사한 K 명의 이웃을 사용 ② Thresholding : 유사도의 기준을 정해두고(ex. 0.7 이상) 그에 따라서 이웃을 정하는 방식. KNN보다 정확도는 높지만, Coverage가 낮아진다(추천할 수 있는 사용자의 %가 줄어든다) → Thresholding의 경우 해당 조건을 만족하는 이웃이 존재하지 않을 수 있으므로, 주로.. 2021. 10. 11. [머신러닝] KNN 개념 정리 ◈ 개념 • 작동 방식이나 개념이 상대적으로 이해가 쉬워서, 가장 빈번하게 사용되는 알고리즘 중 하나이다. • Make no assumptions about data. 즉, data-driven 성격이며 model-driven이 아니다. • 거리를 계산하는 방식은 여러가지가 있지만, 주로 Euclidean / Manhattan / Chybyshev distance 를 사용한다. • 계산에 사용하는 predictor 변수의 스케일 차이가 많이 나면, 거리 계산이 올바로 되지 않을 수 있으므로 정규화(normalize)를 실시하는 것이 적절하다. • 아래 예제에서 Manhattan은 2+1=3, Chybyshev은 2로 계산된다. ◈ 장점 • 데이터셋이 크고, 각 클래스가 multiple combinatio.. 2021. 10. 6. 이전 1 다음