본문 바로가기

추천시스템16

협업필터링 - 아이템 기반(IBCF) ◈ 참고자료 출처 • "Python을 이용한 개인화 추천시스템", 임일, 청람 ◈ 개념 (1) UBCF(User-Based Collaborative Filtering) • 사용자간 유사도 사용 → 사용자별로 개인화된 추천 리스트 • 사용자를 기반으로 하기 때문에 데이터 변화에 민감함. • 계산량이 많음 (아이템 보다 사용자 수가 많기 때문에) (2) IBCF(Item-Based Collaborative Filtering) • 아이템간 유사도 사용 → 사용자가 선택한 아이템이 같으면 동일한 추천리스트 • Robustness가 높음 = Coverage가 높음 → 사용자가 아이템 하나만 평가하면 추천이 가능함 • 계산량이 적고 데이터 변화에 덜 민감함 • 상대적으로 대규모 상업용 시스템에 더 많이 사용됨 • .. 2021. 11. 4.
협업필터링 + KNN ◈ 협업필터링과 KNN을 함께 사용 • 특정 사용자에 대해서 예측값 가중치를 계산할 때, 가장 가까운 K명의 neighbor의 데이터만 사용하는 방식 ✔ 가정 • 취향이 비슷한 사람들은 모든 아이템에 대한 선호가 일관되게 유사하다 • 추천 대상인 사용자와 유사도가 높은 사용자일수록, 취향을 정확하게 반영할 수 있다. ✔ 이웃의 크기 결정 방식 ① KNN : 특정 사용자와 최대한 유사한 K 명의 이웃을 사용 ② Thresholding : 유사도의 기준을 정해두고(ex. 0.7 이상) 그에 따라서 이웃을 정하는 방식. KNN보다 정확도는 높지만, Coverage가 낮아진다(추천할 수 있는 사용자의 %가 줄어든다) → Thresholding의 경우 해당 조건을 만족하는 이웃이 존재하지 않을 수 있으므로, 주로.. 2021. 10. 11.
협업필터링 기본 📚 Collaborative Filtering 개념 ✅ 기본 개념 협업필터링(CF)는 가장 보편적으로 많이 알려지고 사용되는 추천 알고리즘이다. 기본적인 협업 필터링은 사용자 A에게 추천을 할 때, A와 유사한 취향을 가진 이웃들을 찾고 이 사람들이 좋아하는 상품이나 서비스를 추천하는 방식으로 진행된다. • 기본 가정 - 사용자로부터 아이템에 대한 명시적/묵시적 평가를 데이터로 구할 수 있다 - 사용자들의 평가 데이터에서 취향이 비슷한 사람을 찾아낼 수 있고, 취향이 비슷한 사람들은 선호 패턴이 비슷하다 • 추천이 적합한 도메인과 그렇지 않은 도메인이 존재한다. 추천이 잘 맞는 도메인은 사람들의 취향이 일관되게 나타나는 도메인이다. 예를 들어, 영화의 경우 한 사람의 취향이 일관되게 유지되는 경우가 많다.. 2021. 10. 11.
추천시스템 관련 기본 개념 📚추천시스템 기본 용어 정리 • Recommendation System 이란? : technical 하게 정의를 내리자면, "모든 고객에 대해서, 모든 아이템에 대한 예상 선호도를 예측하는 시스템" 이라고 볼 수 있다. • 명시적(Explicit) 데이터 vs 묵시적(Implicit) 데이터 명시적 데이터 : 명확하게 자신의 취향을 나타내는 데이터 묵시적 데이터 : 취향을 추론할 수 있는 데이터 - 점수(별점) - 좋아요, 구독 - 구매 - 장바구니 담기 - Click → 머무는 시간, 방문 횟수 - 시청 여부, 시청 시간 - 구매 (?) - 장바구니 담기 장바구니의 경우 명시/묵시 둘 다에 포함될 수 있다. 구매로 이어지는 확실한 단계이기는 하지만, 일부 경우에는 단순 가격 비교를 위한 수단으로 사용할.. 2021. 10. 8.