본문 바로가기

전체 글184

[2022. 01. 25] 데이터리안 웨비나 ✅ 취준생을 괴롭히는 고민 1. 특정 회사에 너무 가고 싶다, 혹은 대기업 정규직에 반드시 가야한다. 데분 직군은 경력직 채용 시장은 신입 시장보다 훨씬 크다. 그러니까 일단 신입으로 스타트를 끊어두면 대기업으로 언제든지 갈 수 있다. 인생 좀만 더 길게 보자. 평생 직장이 없다는 것을 그냥 머릿속으로만 담아두지 말고 체감해야 한다(근데 이걸 취준생이 어떻게 체험하나?). 경력직 기회는 널려 있다. 2. 공부해야할 게 너무 많다. 입사를 하는 데에도 자격요건이 다 필요하지 않고, 면접 시에도 다 완벽하게 대답할 필요가 없다. 모르는건 그냥 모른다고 하면 된다. 대신 공부할 때는 우선순위를 정해서 할 것. ✅ 채용 공고 보는 방법 결국 데분은 사바사, 팀바팀이기 때문에 유튜브나 블로그 글로는 모든 정보를 .. 2022. 1. 25.
[추천시스템] E-Commerce Product Recommendation Agents : Use, Characterstics, and Impact ◈ 논문 정보 • Xiao, B., & Benbasat, I. (2007). E-commerce product recommendation agents: Use, characteristics, and impact. MIS quarterly, 137-209. ◈ 요약 본 연구에서는 RA(Recommendation Agents)의 효과에 영향을 미치는 중요 요소들을 통합하여 conceptual model을 제시했다. 선행 연구 사례에서 총 28개의 특징을 도출하고 이를 TAM 모델처럼 하나의 큰 모델로 정립하고자 하였다. RQ 1. How do RA use, RA characterstics, and other factors influence consumer decision making processes and.. 2022. 1. 25.
Context aware 추천, Sparse Matrix 처리 ◈ Context-aware 추천 추천 시스템의 정확도와 만족도는 다양항 상황에 영향을 받는다. 같은 아이템이라도 같이 있는 사람, 날씨, 시간, 검색 도메인에 따라서 선호도가 바뀔 수 있다. 따라서 추천 과정에서 상황을 반영하는 것은 중요하다. ✅ 상황변수를 반영하는 방법 ✔ 상황변수를 직접 반영하는 방법 • 상황변수를 개별 추천엔진의 입력변수로 사용 → 모든 사용자들에게 동일한 영향을 주기 때문에 큰 효과가 없다. ex) 목요일을 변수로 사용하면, 목요일에 추천을 실시할 경우 모든 사용자들에게 같은 값을 더하거나 빼면 의미가 없어진다. ✔ 상황변수를 개별 추천엔진을 결합하는데에 사용 여러 알고리즘을 결합할 때 상황변수를 가중치로 사용할 수 있다. 예를 들어, 월요일에는 추천엔진 1의 비중이 크게, 토.. 2022. 1. 24.
하이브리드 추천시스템 ◈ Hybrid Recommder System 최근에 사용되는 추천시스템은 단일 알고리즘만을 사용하는 경우는 드물고 주로 두 가지 이상의 알고리즘을 혼합해서 사용하는 hybrid model 형태가 많다. 이를 통해서 추천 정확도를 보다 향상시킬 수 있다. 아마존의 경우 수백 개의 알고리즘을 동시에 사용한다. 예를 들어, 데이터가 충분하지 않은 사용자는 best-seller, 충분한 사용자에게는 CF를 사용할 수 있다. 일반적으로 A, B모델 중에서 A모델의 성능이 좋게 나타날 떄, 이 두개의 모델을 결합하면 성능이 떨어진다고 생각할 수 있다. 하지만 실제로 서로 다른 모델을 함께 사용하면 오버피팅이 감소하기 때문에 성능이 계선된다. (두 모델을 결합한다는 것은 예측한 개별 Rating들을 결합한다는 의미.. 2022. 1. 24.
Matrix Factorization : 텐서플로우, 케라스로 구현 ◈ 추천시스템 알고리즘에서 딥러닝 사용하기 ✅ MF를 딥러닝으로 표현하기 각 유저와 아이템을 원 핫 인코딩을 하고, 이것을 임베딩 레이어와 연결한다. 임베딩 레이어의 노드 수는 피쳐의 수 k와 동일하게 설정한다. 이를 dense layer로 연결하면 총 k * 사용자 수 만큼의 연결이 생긴다. 파란색 부분에서 Input Layer와 Embedding Layer 를 연결하는 가중치(화살표)는 P 매트릭스에서 해당 사용자의 row와 동일하다 따라서 한 사용자에 대해서는 (위의 그림에서는 사용자2) input layer에서 하나의 값만 활성화되기 떄문에, 결국 임베딩 레이어의 값은 P 매트릭스의 한 row와 동일하다. 그리고 노란색 부분에서 내적을 수행한다(MF에서 P x Q 매트릭스의 곱하기를 수행하는 것과.. 2022. 1. 23.
추천 알고리즘 - Factorization Machines ◈ Factorization Machine 이란 MF나 SVD++를 일반화한 모델이다. CF 계열 알고리즘의 끝판왕이라고 볼 수 있다. MF의 경우유저와 아이템 두 가지 입력변수가 rating에 미치는 공통의 K 개의 feature를 P,Q 매트릭스 형태로 추출해서 사용한다. SVD++는 P, Q 매트릭스외에 또다른 K 개의 리처를 추가적으로 뽑아낸다. 만약 n개의 다수의 입력 변수를 사용하는 것을 일반화 한 모델이 Factorization Machine 이다. 즉, n개의 변수가 있을 때, 모든 2개의 변수 짝의 interaction에 대해서 피쳐를 뽑아내서 factorize 하는 방식이다. n=2이라면 구조상 MF와 동일하다. ✅ FM의 장점 • 변수의 독립적인 영향 뿐만 아니라, 변수 간의 상호작용.. 2022. 1. 23.