본문 바로가기

추천시스템16

추천시스템 데이터 정리 📚 사용가능한 추천시스템 데이터 정리 ✔ 🏷️📌📘 ✅ 카카오 아레나 멜론 플레이 리스트 데이터 https://arena.kakao.com/c/7 • 학습, 평가, 테스트 셋 위와 같은 형태로 구성. Train (115,000개) / Val (23000개) / Test (10000개) • 곡 메타데이터 관련 게시글 https://brunch.co.kr/@kakao-it/342 https://brunch.co.kr/@kakao-it/343 • 곡에 대한 멜 스펙토그램 데이터도 제공한다. 분량이 매우 크기 때문에 유의 2022. 2. 18.
추천시스템 공부 자료 정리 ✅ 스포티파이 Annoy https://github.com/spotify/annoy ✅ Recsys 유튜브 https://www.youtube.com/channel/UC2nEn-yNA1BtdDNWziphPGA ✅ 투빅스 추천시스템 논문 리뷰 https://velog.io/@tobigs-recsys 동아리 활동 자료, 참고 ✅ SK Planet 추천시스템 유튜브 강의 https://www.youtube.com/watch?v=43gb7WK56Sk ✅ Awesome Recsys 깃허브 https://github.com/jihoo-kim/awesome-RecSys ✅ Graph 기반 기법들 정리 https://github.com/RS-KR/GNN-RS-Beginner ✅ Pandas plot ✅ GNN을 이용한.. 2022. 2. 7.
추천시스템 연구 아이디어 정리 보호되어 있는 글 입니다. 2022. 2. 5.
Context aware 추천, Sparse Matrix 처리 ◈ Context-aware 추천 추천 시스템의 정확도와 만족도는 다양항 상황에 영향을 받는다. 같은 아이템이라도 같이 있는 사람, 날씨, 시간, 검색 도메인에 따라서 선호도가 바뀔 수 있다. 따라서 추천 과정에서 상황을 반영하는 것은 중요하다. ✅ 상황변수를 반영하는 방법 ✔ 상황변수를 직접 반영하는 방법 • 상황변수를 개별 추천엔진의 입력변수로 사용 → 모든 사용자들에게 동일한 영향을 주기 때문에 큰 효과가 없다. ex) 목요일을 변수로 사용하면, 목요일에 추천을 실시할 경우 모든 사용자들에게 같은 값을 더하거나 빼면 의미가 없어진다. ✔ 상황변수를 개별 추천엔진을 결합하는데에 사용 여러 알고리즘을 결합할 때 상황변수를 가중치로 사용할 수 있다. 예를 들어, 월요일에는 추천엔진 1의 비중이 크게, 토.. 2022. 1. 24.
하이브리드 추천시스템 ◈ Hybrid Recommder System 최근에 사용되는 추천시스템은 단일 알고리즘만을 사용하는 경우는 드물고 주로 두 가지 이상의 알고리즘을 혼합해서 사용하는 hybrid model 형태가 많다. 이를 통해서 추천 정확도를 보다 향상시킬 수 있다. 아마존의 경우 수백 개의 알고리즘을 동시에 사용한다. 예를 들어, 데이터가 충분하지 않은 사용자는 best-seller, 충분한 사용자에게는 CF를 사용할 수 있다. 일반적으로 A, B모델 중에서 A모델의 성능이 좋게 나타날 떄, 이 두개의 모델을 결합하면 성능이 떨어진다고 생각할 수 있다. 하지만 실제로 서로 다른 모델을 함께 사용하면 오버피팅이 감소하기 때문에 성능이 계선된다. (두 모델을 결합한다는 것은 예측한 개별 Rating들을 결합한다는 의미.. 2022. 1. 24.
Matrix Factorization : 텐서플로우, 케라스로 구현 ◈ 추천시스템 알고리즘에서 딥러닝 사용하기 ✅ MF를 딥러닝으로 표현하기 각 유저와 아이템을 원 핫 인코딩을 하고, 이것을 임베딩 레이어와 연결한다. 임베딩 레이어의 노드 수는 피쳐의 수 k와 동일하게 설정한다. 이를 dense layer로 연결하면 총 k * 사용자 수 만큼의 연결이 생긴다. 파란색 부분에서 Input Layer와 Embedding Layer 를 연결하는 가중치(화살표)는 P 매트릭스에서 해당 사용자의 row와 동일하다 따라서 한 사용자에 대해서는 (위의 그림에서는 사용자2) input layer에서 하나의 값만 활성화되기 떄문에, 결국 임베딩 레이어의 값은 P 매트릭스의 한 row와 동일하다. 그리고 노란색 부분에서 내적을 수행한다(MF에서 P x Q 매트릭스의 곱하기를 수행하는 것과.. 2022. 1. 23.