본문 바로가기

추천시스템7

[추천시스템] 추천시스템 기법 연구동향 분석 📚 논문 정보 손지은, 김성범, 김현중, & 조성준. (2015). 추천 시스템 기법 연구동향 분석. 대한산업공학회지, 41(2), 185-208. 📚 요약 이 논문은 추천시스템의 종류, 특징, 장단점, 평가 방식, 사용 소프트웨어 동향 등을 정리하여 분석하였다. 향후 연구 주제 선정 및 진행에 도움이 될 수 있는 내용이 많아서 정리하였다. 본 논문에서 정리한 추천시스템 기법의 분류는 다음과 같다. ✅ 콘텐츠 기반 필터링 아이템 콘텐츠를 직접 분석해서 아이템과 아이템 or 아이템과 사용자의 유사도로 추천하는 방식이다. ①에서 고객의 선호도를 파악할 때 과거의 구매이력이나 사용자의 프로필 정보를 사용한다. 따라서 CF처럼 고객의 평가 정보가 없더라고 추천을 할 수 있다는 장점이 있다. 또한, 아이템이 새롭.. 2022. 2. 9.
[추천시스템] E-Commerce Product Recommendation Agents : Use, Characterstics, and Impact ◈ 논문 정보 • Xiao, B., & Benbasat, I. (2007). E-commerce product recommendation agents: Use, characteristics, and impact. MIS quarterly, 137-209. ◈ 요약 본 연구에서는 RA(Recommendation Agents)의 효과에 영향을 미치는 중요 요소들을 통합하여 conceptual model을 제시했다. 선행 연구 사례에서 총 28개의 특징을 도출하고 이를 TAM 모델처럼 하나의 큰 모델로 정립하고자 하였다. RQ 1. How do RA use, RA characterstics, and other factors influence consumer decision making processes and.. 2022. 1. 25.
추천시스템에서 Binary Data의 사용 ◈ 추천시스템에서 Binary Data 다루기 클릭, 좋아요, 읽기, 머무르기 등의 행동 데이터를 의미하며 implicit data에 해당된다. Binary 데이터는 크게 두 가지 방향으로 사용될 수 있다. 1. Binary Data로 순서 예측 Markov Model을 기반으로 해서 이진 데이터가 나타내는 행동으로부터 사용자가 다음으로 할 행동을 예측한다. A,B,C 페이지를 차례대로 방문한 사용자가 다음에 어떤 페이지를 방문할 지 예측할 수 있다. 하지만 클릭 로그가 굉장히 많아질 경우, 동일한 경로로 클릭을 한 다른 사용자가 존재하지 않을 수도 있다. 이러한 경우 가장 초기 기록부터(A부터) 없애가면서 동일한 사용자들을 비교한다. 하지만 이 방식은 많이 사용되지 않는다. 이진 데이터로 예측을 할 경.. 2022. 1. 22.
추천 알고리즘 - Matrix Factorization ✅ 협업필터링의 두 가지 방식 ① Memory-based Approach 추천할 때 마다 Raw 데이터를 활용해서 계산하고 추천에 사용하는 방식 • 이전 포스팅에서 다룬 기본적인 협업필터링 알고리즘은 모두 메모리 기반 알고리즘이라고 볼 수 있다. • 계산량이 많기 때문에 현실의 빅데이터를 사용한 모델에는 적합하지 않음 ② Model-based Approach raw데이터로 미리 학습한 모델을 만들어두고, 추천할 때는 미리 학습한 모델로 예측하는 방식 • 모델 기반 접근은 주기적으로 업데이트할 필요가 있다. • Weak Signal 을 파악할 수 있다. 여러 사용자들 사이에서 나타나는 약한 패턴도 파악할 수 있다. 여러 개의 데이터를 동시에 고려해서 공통된 피쳐를 추출할 수 있다. 이를 바탕으로 메모리 기.. 2022. 1. 14.
협업필터링 - 사용자의 평가 경향 고려 ◈ 참고자료 출처 • "Python을 이용한 개인화 추천시스템", 임일, 청람 ◈ 개념 ✅ 사용자의 평가 경향 고려 : Bias-From-Mean Average • 일반적으로 사용자마다 평점을 부여하는 기준이 다르기 때문에, 해당 평점이 가지는 의미도 다르게 된다. 같은 평점 3점을 부여했더라도 평균이 2점인 사용자와 평균이 4점인 사용자의 의미가 다르다. 즉, 평점을 계산할 때 해당 사용자의 평가 경향을 고려할 필요가 있다. • 이러한 단점을 보완하기 위해서 원래 평점에서 해당 사용자의 평균 평점을 빼서, 다른 유저와의 유사도로 가중평균해서 예상 평점 계산한다. 평가 경향 반영한 평균 계산 식 → 의미 : 해당 아이템의 평점이 해당 유저의 평균에서 얼마나 떨어져 있는지를 계산하는 식임 # moviele.. 2021. 12. 27.
협업필터링 - 아이템 기반(IBCF) ◈ 참고자료 출처 • "Python을 이용한 개인화 추천시스템", 임일, 청람 ◈ 개념 (1) UBCF(User-Based Collaborative Filtering) • 사용자간 유사도 사용 → 사용자별로 개인화된 추천 리스트 • 사용자를 기반으로 하기 때문에 데이터 변화에 민감함. • 계산량이 많음 (아이템 보다 사용자 수가 많기 때문에) (2) IBCF(Item-Based Collaborative Filtering) • 아이템간 유사도 사용 → 사용자가 선택한 아이템이 같으면 동일한 추천리스트 • Robustness가 높음 = Coverage가 높음 → 사용자가 아이템 하나만 평가하면 추천이 가능함 • 계산량이 적고 데이터 변화에 덜 민감함 • 상대적으로 대규모 상업용 시스템에 더 많이 사용됨 • .. 2021. 11. 4.