본문 바로가기

전체 글184

[추천시스템] Feature-level Deeper Self-Attention Network for Sequential Recommendation 📚 논문 정보 📚 요약 모델 구조 설명 Embedding Layer 유저들의 시퀀스가 각기 다르기 때문에 시퀀스 s의 길이를 n으로 통일하였다. n은 모델이 다룰 수 있는 최대 길이이다. 시퀀스가 짧은 경우는 왼쪽부터(가장 과거부터) zero padding을 실시한다. 만약 시퀀스가 n 보다 클 경우에는 가장 최근의 데이터만 사용한다. lookup layer를 사용해서 원핫 벡터 형태인 action sequence : s 와 category sequence : c 를 dense vector 형태로 변경한다. 카테고리 외에 브랜드, 판매자 등 해당 상품과 관련이 있는 변수들은 동일하게 시퀀스로 처리하였다. 또한 제품 설명, 제목 등의 텍스트 데이터에 대해서는 토픽모델링으로 5개의 토픽을 추출하고 Word2.. 2022. 4. 10.
Editor's Comments : Machine Learning in Information Systems Research 📚 논문 정보 Padmanabhan, B., Sahoo, N., & Burton-Jones, A. (2022). Machine Learning in Information Systems Research. Management Information Systems Quarterly, 46(1), iii-xix. 📚 요약 최근 다양한 분야에서 인공지능을 사용한 연구가 진행되고 있으며, 정보시스템 분야에서도 많은 주목을 받고 있다. 이 페이퍼는 MISQ 편집 위원들의 정보시스템 분야에서 머신러닝을 사용한 연구에 대한 코멘트를 정리하였다. 정보시스템 분야에서 머신러닝 연구는 크게 두 가지로 분류할 수 있다. (1) Study ML-related phenomena in particular context  how ML.. 2022. 4. 7.
Finding People with Emotional Distress in Online Social Media : A Design Combining Machine Learning and Rule-Based Classification 📚 논문 정보 Chau, M., Li, T. M., Wong, P. W., Xu, J. J., Yip, P. S., & Chen, H. (2020). Finding People with Emotional Distress in Online Social Media: A Design Combining Machine Learning and Rule-Based Classification. MIS Quarterly, 44(2). 📚 요약 온라인 상의 게시글은 작성자의 metal health를 파악하는 데에 유용한 정보를 제공한다. 이 연구는 이러한 아이디어를 바탕으로 온라인 상에서 정서적인 불안감을 표출하는 사람들을 탐색하는 시스템인 KAREN을 제안한다. KAREN은 블로그 크롤러, ML분류기, 규칙기반 분류기,.. 2022. 4. 7.
IS 분야에서 Machine Learning 연구 📚 정보시스템 분야에서 ML을 사용한 연구 ML은 주로 컴퓨터 공학, 산업공학 분야에서 사용되었지만, 최근에는 정보시스템 분야에서도 ML이 사용된 연구가 증가하고 있다. 각 도메인마다 ML을 사용하는 성격이 다른데 CS는 알고리즘 위주, 산업공학은 알고리즘+application, IS는 application 위주이다. ML을 적용하기 최적의 영역은 Invention이고, 다음으로는 Improvement이다. Routine Design은 피해야 한다. ✅IS 분야에서 ML 논문 비중이 높은 저널 • MIS Quarterly, Information Systems Research, JMIS, JAIS → MISQ도 과거에는 ML 논문을 받지 않았지만, 최근에 점점 증가하는 추세이다. • Decision sup.. 2022. 4. 7.
[개인 프로젝트] 영화 관람객 수 예측 모델 📚 분석 개요 • 진행기간 : 2022.03.25 ~ 2022.04.02 • 참여인원 : 개인 • 사용 데이터 : 네이버 영화 정보 및 평점 데이터 • 분석 목적 : 이 분석에서는 국내에서 2005~2018년 기간에 개봉한 영화들의 데이터를 이용해서 관람객 수를 예측하는 모델을 만든다. 전체 분석 및 모델 구축 프로세스는 아래와 같다. 📌 목차 1. 데이터 및 라이브러리 불러오기 2. EDA(데이터 탐색) 2.1 기초통계량 확인 2.2 데이터 시각화 2.3 상관계수 확인 3. 추가 외부변수 수집 4. 데이터 전처리 4.1 결측치 처리 4.2 이상치 처리 4.3 더미변수화 4.4 Train/Test split 4.5 Feature Scaling 5. 모델 학습 6. 모델 성능 평가 📚 1.데이터 및 라이브.. 2022. 4. 4.
[텍스트 마이닝] Job Satisfaction and Employee Turnover Determinants in Fortune 50 Companies : Insights from employee reviews from Indeed.com 📚 논문 정보 Stamolampros, P., Korfiatis, N., Chalvatzis, K., & Buhalis, D. (2019). Job satisfaction and employee turnover determinants in high contact services: Insights from Employees’ Online reviews. Tourism Management, 75, 130-147. 📚 요약 Sturctural Topic Modeling은 위와 같이 세 가지 알고리즘(STM, DMR, SAGE)를 결합한 알고리즘이다. 기존 토픽모델링 기법에 외부 변수(=covariate, metadata)의 영향을 반영해서 토픽을 추출할 수 있다. 이 연구에서는 최적의 토픽을 평가하기 위해서 .. 2022. 3. 31.