본문 바로가기
논문 리뷰/머신러닝, 딥러닝

[머신러닝] Predicting Service Industry Performance Using Decision Tree Analysis

by 장찐 2022. 3. 24.

📚 논문 정보 

Yeo, B., & Grant, D. (2018). Predicting service industry performance using decision tree analysis. International Journal of Information Management, 38(1), 288-300.


📚 요약 

 

 이 연구는 ICT가 서비스 산업에 미치는 영향을 분석하였다. ICT와 performance에 대한 주제로 많은 연구가 이루어졌지만 일관된 결론을 도출하지 못했다. ICT의 도입은 여러 긍정적인 측면도 있지만 잘못 사용할 경우 오히려 부정적인 영향을 초래할 수도 있다. ICT와 관련된 여러 요소 중에서 Financial context는 비즈니스 성과와 경제 성장에 큰 영향을 미치는 중요한 요소로 밝혀졌다.

 IS 분야의 이론 중에서 본 연구에서는 Technology, Organization, Environment (TOE) 이론을 기반으로 ICT가 financial context에서 서비스 산업의 매출에 미치는 영향을 분석하였다. TOE 프레임워크는 유연하게 사용이 가능하기 때문에 이 연구에서는 Technology, Environment 항목만 사용하였다. 


 분석을 위해서 World Bank의 World Enterprise Survey 데이터를 사용하였다. 135개 국가의 company-level 데이터이고 수집 기간은 2006년~2015년이다. 12개의 항목 중에서 technology, innovation, financial 변수를 사용하였다. 

 이 연구에서는 서비스 산업의 매출 증대에 중요한 요인을 탐색하기 위해서 Chi-square Automatic Interaction Detector Decision Tree를 사용하였다. 이 기법은 각 노드에서 하위 브랜치를 생성할 때 카이스퀘어 검정을 이용하고 multiple node를 생성한다.

 

 

분석 결과 모델의 정확도는 73%로 상당히 높게 나타났으며, 재무 관련 변수의 중요도가 높게 나타났다. 1위~3위 까지의 중요 변수는 모두 재무 관련 변수였으며 이메일 사용 비율이 4위에 위치했다. 즉, 서비스 산업의 performance에는 재무적 변수가 큰 영향을 미치고 ICT 변수는 상대적으로 영향이 적다는 것을 알 수 있다. 그리고 이를 바탕으로 IS 분야에서 ICT의 영향에 관한 향후 연구 가설들을 제안하였다.

 


📚 장점 및 의의 

 

• 대부분의 연구에서는 사용한 이론에 대한 설명과 사례를 제시하고 해당 연구에 이론을 어떻게 접목할 수 있을지를 나열한다. 하지만, 이 연구에서는 TOE 가설을 사용하면서 가설을 선택한 과정을 상세하게 잘 설명하였기 때문에 이론 채택 과정이 보다 설득력 있다는 생각이 들었다.

 

• 또한 Decision Tree를 이용하여 분석을 진행하고 이에 대한 결과를 상세하게 설명하였다. 최근 머신러닝 모델의 단점인 Black Box를 해결하기 위해서 설명가능한 AI가 많은 주목을 받고 있다. Decision Tree는 단순하고 쉽게 접할 수 있는 알고리즘이지만 이를 이용해서 결과에 대한 풍부한 해석을 시도했다는 점이 인상깊었다. 머신러닝 모델의 성능에 초점을 두는 것이 아니라, 분석적인 측면에서 결과를 어떻게 풀어내는 것이 바람직한 연구인지에 대해서 고민하는 계기가 되었다.

 


📚 한계점 및 추가 연구 아이디어 

 

• 이 연구에서 사용한 월드뱅크 데이터에서 ICT를 반영하는 변수에는 4가지가 있다. 웹사이트 보유 비율, 이메일 사용여부 등의 변수를 사용하는데 이 변수들이 현재의 ICT의 특징을 충분히 반영할 수 있는지에 대한 의문이 들었다. 해당 논문이 2017년도에 게재가 된 점을 고려했을 때, 새로운 업무 형태를 반영하는(ICT 기반 재택근무, 유연근무 등) 변수들이 사용되지 않은 점이 아쉬웠다.  

 

 

 

댓글