본문 바로가기

전체 글184

추천시스템 관련 기본 개념 📚추천시스템 기본 용어 정리 • Recommendation System 이란? : technical 하게 정의를 내리자면, "모든 고객에 대해서, 모든 아이템에 대한 예상 선호도를 예측하는 시스템" 이라고 볼 수 있다. • 명시적(Explicit) 데이터 vs 묵시적(Implicit) 데이터 명시적 데이터 : 명확하게 자신의 취향을 나타내는 데이터 묵시적 데이터 : 취향을 추론할 수 있는 데이터 - 점수(별점) - 좋아요, 구독 - 구매 - 장바구니 담기 - Click → 머무는 시간, 방문 횟수 - 시청 여부, 시청 시간 - 구매 (?) - 장바구니 담기 장바구니의 경우 명시/묵시 둘 다에 포함될 수 있다. 구매로 이어지는 확실한 단계이기는 하지만, 일부 경우에는 단순 가격 비교를 위한 수단으로 사용할.. 2021. 10. 8.
[머신러닝] Naive Bayes 개념 정리 📚 나이브 베이즈 개념 • 예측에 사용하는 특성과 결과 값 사이의 dependency relationship을 사용한다. Bayes theorem에 따라서 확률적인 계산을 수행하므로, 엄격하게 말해서 model-based 알고리즘과는 차이가 있다. • 조건부 확률을 기반으로, 분류할 데이터가 주어졌을 때 다른 유사한 데이터 레코드들이 어떤 class로 분류되는지를 계산하는 것이 핵심 아이디어. ✅ Bayes' Theorem · A : 알고자 하는 class(종속변수) / B : 주어진 predictor(독립변수) · 나이브 베이즈의 핵심, Bayes' Theorem을 이용하여 P(A|B)를 계산하기 위해서 P(B|A)를 사용한다. · 위와 같이 예측하고자 하는 레코드와 same predictor valu.. 2021. 10. 8.
[계량경제] Unemployment and Digital Public Goods Contribution ◈ 논문 정보 Kummer, Michael, Olga Slivko, and Xiaoquan Zhang. "Unemployment and digital public goods contribution." Information Systems Research 31.3 (2020): 801-819. ◈ 논문 요약 수업에서 논문 발표한 PPT 자료를 정리하여 포스트를 작성하였습니다. · 선행 연구 사례들은 주로 경제 위기 시기에 기부 금액의 증감을 파악한 내용들이 많다. 예상과는 다르게 경제 위기에도 기부금은 감소하지 않았고, 오히려 경제 위기 종료 후 기부가 증가한 결과들이 많았다. 기부금과는 달리 공공재의 경우는 올바로 측정하기 힘든 경우가 많다. 이 연구에서는 공공재 중에서도 온라인 공공재(Online Pub.. 2021. 10. 8.
[머신러닝] KNN 개념 정리 ◈ 개념 • 작동 방식이나 개념이 상대적으로 이해가 쉬워서, 가장 빈번하게 사용되는 알고리즘 중 하나이다. • Make no assumptions about data. 즉, data-driven 성격이며 model-driven이 아니다. • 거리를 계산하는 방식은 여러가지가 있지만, 주로 Euclidean / Manhattan / Chybyshev distance 를 사용한다. • 계산에 사용하는 predictor 변수의 스케일 차이가 많이 나면, 거리 계산이 올바로 되지 않을 수 있으므로 정규화(normalize)를 실시하는 것이 적절하다. • 아래 예제에서 Manhattan은 2+1=3, Chybyshev은 2로 계산된다. ◈ 장점 • 데이터셋이 크고, 각 클래스가 multiple combinatio.. 2021. 10. 6.
[계량경제] Show Me The Way to go Home : An Empirical Investigation of Ride-Sharing and Alcohol Related Motor Vehicle Fatalities ◈ 논문 정보 Greenwood, Brad N., and Sunil Wattal. "Show Me the Way to Go Home: An Empirical Investigation of Ride-Sharing and Alcohol Related Motor Vehicle Fatalities." MIS Q. 41.1 (2017): 163-187. ◈ 요약 본 연구에서는 우버 블랙의 도입에 따른 DUI(Drive Under Influence) 감소를 Research Question으로 설정하고, 다음과 같이 두 가지 가설을 설정하였다. H1 : Premium ride-sharing 서비스 도입으로 인해서, 음주 관련 교통사고 비율이 줄었을 것이다 H2 : Discount ride-sharing 서비스 도입으.. 2021. 10. 5.
[계량경제] Combating Procrastination on Massive Online Open Courses via Optimal Calls to Action ◈ 논문 정보 Ni Huang, Jiayin Zhang*, Gordon Burtch, Xitong Li, Peiyu Chen (2021) Combating Procrastination on Massive Online Open Courses via Optimal Calls to Action. Information Systems Research 32(2):301-317. https://doi.org/10.1287/isre.2020.0974 ◈ 요약 본 연구에서는 MOOC 이용자를 대상으로 procrastination을 감소시키는 CTA(Calls to Action)에 대해서 탐색했다. Research Question은 다음과 같다. 1. MOOC 학습자들에게 어떤 유형의 CTA가 procrastination.. 2021. 10. 5.