협업필터링3 협업필터링 - 사용자의 평가 경향 고려 ◈ 참고자료 출처 • "Python을 이용한 개인화 추천시스템", 임일, 청람 ◈ 개념 ✅ 사용자의 평가 경향 고려 : Bias-From-Mean Average • 일반적으로 사용자마다 평점을 부여하는 기준이 다르기 때문에, 해당 평점이 가지는 의미도 다르게 된다. 같은 평점 3점을 부여했더라도 평균이 2점인 사용자와 평균이 4점인 사용자의 의미가 다르다. 즉, 평점을 계산할 때 해당 사용자의 평가 경향을 고려할 필요가 있다. • 이러한 단점을 보완하기 위해서 원래 평점에서 해당 사용자의 평균 평점을 빼서, 다른 유저와의 유사도로 가중평균해서 예상 평점 계산한다. 평가 경향 반영한 평균 계산 식 → 의미 : 해당 아이템의 평점이 해당 유저의 평균에서 얼마나 떨어져 있는지를 계산하는 식임 # moviele.. 2021. 12. 27. 협업필터링 - 아이템 기반(IBCF) ◈ 참고자료 출처 • "Python을 이용한 개인화 추천시스템", 임일, 청람 ◈ 개념 (1) UBCF(User-Based Collaborative Filtering) • 사용자간 유사도 사용 → 사용자별로 개인화된 추천 리스트 • 사용자를 기반으로 하기 때문에 데이터 변화에 민감함. • 계산량이 많음 (아이템 보다 사용자 수가 많기 때문에) (2) IBCF(Item-Based Collaborative Filtering) • 아이템간 유사도 사용 → 사용자가 선택한 아이템이 같으면 동일한 추천리스트 • Robustness가 높음 = Coverage가 높음 → 사용자가 아이템 하나만 평가하면 추천이 가능함 • 계산량이 적고 데이터 변화에 덜 민감함 • 상대적으로 대규모 상업용 시스템에 더 많이 사용됨 • .. 2021. 11. 4. 협업필터링 + KNN ◈ 협업필터링과 KNN을 함께 사용 • 특정 사용자에 대해서 예측값 가중치를 계산할 때, 가장 가까운 K명의 neighbor의 데이터만 사용하는 방식 ✔ 가정 • 취향이 비슷한 사람들은 모든 아이템에 대한 선호가 일관되게 유사하다 • 추천 대상인 사용자와 유사도가 높은 사용자일수록, 취향을 정확하게 반영할 수 있다. ✔ 이웃의 크기 결정 방식 ① KNN : 특정 사용자와 최대한 유사한 K 명의 이웃을 사용 ② Thresholding : 유사도의 기준을 정해두고(ex. 0.7 이상) 그에 따라서 이웃을 정하는 방식. KNN보다 정확도는 높지만, Coverage가 낮아진다(추천할 수 있는 사용자의 %가 줄어든다) → Thresholding의 경우 해당 조건을 만족하는 이웃이 존재하지 않을 수 있으므로, 주로.. 2021. 10. 11. 이전 1 다음