본문 바로가기
논문 리뷰/머신러닝, 딥러닝

[머신러닝] 머신러닝 기반의 보상형 크라우드펀딩 성공 예측 모델링

by 장찐 2022. 6. 1.

📚 논문 정보 

문동지, 윤상혁, 최수빈, & 김희웅. (2020). 머신러닝 기반의 보상형 크라우드펀딩 성공 예측 모델링. Korea Business Review, 24(3), 125-143.


📚 요약 

 크라우드 펀딩은 다수의 개인으로부터 자금을 모으는 행위를 의미한다. 국내 크라우드 펀딩은 실패 비율이 38%가량으로 상당히 높은 편이다. 따라서 펀딩 참여자 입장에서는 시간적 기회비용과 자금 조달 측면에서 성공 여부를 파악하는 것이 매우 중요하다. 현재 크라우드 펀딩과 관련된 연구 사례는 많지 않으며, 기존 연구도 주로 펀딩 종료 이후 데이터를 사용하거나 정확도가 낮다는 한계점이 있다. 따라서 이 연구에서는 머신러닝으로 펀딩 초기에 보상형 크라우드펀딩의 성공 예측을 진행한다.

 사용 데이터는 와디즈에서 보상형 크라우드펀딩 프로젝트 7316건에 대한 데이터를 수집했다. 일반적인 크라우드 펀딩 맥락에서 사용되는 변수들은 기존 연구에서 탐색하였고 커뮤니티 댓글, 펀딩 참여 건수, 페이스북 지지 서명 횟수 등을 이 연구의 특징적인 변수로 사용하였다.

 전체 연구 절차는 아래와 같다. (2)변수 가공 단계에서는 감성분석 수행을 위해서 KoALA를 사용하였다. (3)변수 선택에서는 로지스틱 회귀를 이용해서 변수의 타당성을 검증하고 예측 모델을 구축하면서 설명력이 높은 변수 조합을 탐색했다. 이 연구에서는 Decision Tree, Naive Bayes, SVM, Gradient Boosting, Random Forest, AdaBoost, MLP의 7가지 머신러닝 알고리즘을 사용해서 예측을 진행하고 평가하였다. 또한 크라우드 펀딩 실패 여부를 예측하는 것이 중요하기 때문에 모델 학습 및 평가에서도 accuracy 보다 precision을 위주로 평가하였다.  

로지스틱 회귀 분석 결과 편딩 성공에 긍정적인 영향을 미치는 요소는 댓글의 평균 감성, 댓글 개수, 새소식 건수, 페이스북 지지서명, 펀딩 참여 건수, 펀딩 좋아요 수, 리워드 개수, 비디오 개수로 나타났다. 반면 부정적인 영향을 주는 변수로는 목표 펀딩금액, 펀딩 기간인 것으로 나타났다. 예측모델에서는 이와 같이 로지스틱 회귀에서 유의미한 변수만을 사용하였다.

예측 결과는 위의 표와 같다. 정밀도 기준으로는 SVM이 가장 높은 성능을 확보하였다. F1 score 기준으로는 AdaBoost, Gradient Boost와 같은 부스팅 기반 알고리즘의 성능이 높게 나타났다.


📚 장점 및 의의 

• 단순히 머신러닝으로 예측 모델링만 진행한 것이 아니라 로지스틱 회귀와 EDA를 통해서 최대한 설명력을 부여하고자 하였다. 로지스틱 회귀의 결과를 통해서 유의한 변수와 유의하지 않은 변수들을 context에 맞게 분석하여 이에 대한 해석을 제공하여서 전체 연구 결과가 보다 설득력이 있다고 느꼈다.

 

• 펀딩 시작 후 7일 이내의 변수들을 위주로 사용하여 차별점을 부여하였다. 실제 크라우드 펀딩 참여자들이 펀딩 시작 후 빠른 시일 내에 의사결정을 해야한다는 점을 고려하면 실무적인 의의가 있는 연구라고 생각한다. 머신러닝 관련 연구에서 routine design에 그치지 않고 머신러닝 사용 필요성과 의의를 적절하게 잘 설명한 연구라고 생각한다.

 


📚 한계점 및 추가 연구 아이디어 

• 와디즈의 고객 정보 및 행동 데이터를 사용한다면 보다 정확한 예측 모델링이 가능할 것이다. 이 연구에서는 불가피하게 외부에서 접근 가능한 정보를 크롤링으로 수집하여 학습하였다. 만약 고객들의 클릭 로그 데이터(세션 시간, 조회 수 등)을 확보할 수 있다면 보다 성능이 좋은 모델을 확보하고 유의미한 인사이트를 도출할 수 있을 것이다.

 

• 최근 크라우드 펀딩에 성공한 상품의 품질이나 서비스에 대한 불만도 많이 발생하고 있다. 판매자가 완제품을 만들어서 그것을 판매하는 것이 아니기 때문에, 자금 조달에 성공하였다 하더라도 제품의 퀄리티를 보장할 수 없다. 게다가 와디즈와 같은 플랫폼은 이에 대해서 책임을 지지 않기 때문에 펀딩 참여자들이 피해를 보는 경우가 많다. 따라서 이 연구 내용을 보다 발전시켜서, 크라우드 펀딩 참여자들의 상품에 대한 만족도, 제품의 완성도 등을 고려하여 최종적인 펀딩 성공여부를 예측하는 모델을 연구할 수 있을 것이라고 생각한다.

 

 

 

댓글