📚 논문 정보
Zhang, Y., Ridings, C., & Semenov, A. (2022). What to post? Understanding engagement cultivation in microblogging with big data-driven theory building. International Journal of Information Management, 102509.
📚 요약
식량 문제는 전 세계적으로 중요 화두로 거론되고 있으며 이를 해결하기 위해서 Alternative Food Network(AFNs)가 주목받고 있다. AFN은 SNS를 이용하여 일반 소비자들에게 식량 문제, 환경 문제, 유기농 재료, 공급 안정성 등과 관련된 이슈를 알리고 관심을 유도하는 relationship cultivation 전략을 사용한다. 이 연구에서는 AFN이 어떻게 Social media engagement를 형성하는지를 분석한다. 구체적인 연구 질문은 아래와 같다.
이 연구는 데이터를 기반으로 theory를 만드는 것을 목적으로 한다.
데이터 수집을 위해서 Weibo API를 이용하였다. 총 90개의 AFN과 관련된 계정에서 55,000개의 게시글과 좋아요/댓글/리트윗 데이터를 수집하였다. 분석 방법으로는 LDA와 Fixed effect regression을 사용했다. 수집한 게시글로 LDA를 실시하였는데 20~80개의 토픽을 모두 검토하였으며, 한 계정의 게시글을 모두 합쳐서 하나의 문서로 간주한 pooled 단위와 계정별 게시글을 모두 다른 문서 단위로 본 non-pooled 단위 두 번의 분석을 진행하였다. literature map을 이용해서 theoretical model을 제안한다. 이론적 모델의 검증은 fixed effect panel data regression으로 실시하였다.
게시글에서 총 50개의 토픽을 추출하였고, 각 토픽을 개념적으로 유사한 construct로 묶어서 Openness/Disclosure, Sharing of Tasks, Knowledge Sharing, Advertising, Irrelevatn Information 의 5가지 개념을 도출했다. 각 토픽과 매칭되는 construct는 다음과 같다.
(1) Openness/Disclosure : topics 6, 12, 15, 19, 21, 40 and 45
(2) Sharing Task : Topics 13, 17, 22, and 23
(3) Knowledge Sharing : Topics 2 and 46
(4) Advertising : Topics 4, 7, 8, 20, 30, 34, 35, 37, 38, 41, 44, 47, and 48
(5) Irrelevant information : Topics 1, 5, 9, 26, 28, 29, and 42
그리고 이를 바탕으로 아래와 같이 Social media engagement에 대한 가설을 도출하였다.
H1 : There is a positive relationship between openness and users' social media engagement
H2 : There is a positive relationship between sharing of tasks and users' social media engagement
H3 : There is a positive relationship between knowledge sharing and users' social media engagement
H4 : There is a negative relationship between Advertising and users' social media engagement
H5 : There is a negative relationship between irrelevant information and users' social media engagement
H5 에서 irrelevatn information이란 농사나 작물과 관련이 없는 주제를 다룬 게시글을 의미한다.
Social media engagement는 좋아요, 공유, 댓글 수로 측정하였다.
통제 변수는 다음과 같이 city level의 경제 변수를 사용하였다 : total population, GDP per capita, total number of Internet users, and share of agricultural labor in total popu
lation
Unit of observation은 각 계정이고, time period는 1년으로 설정했다. 본 연구에서는 engagement를 likes, share, comment로 측정하였기 때문에 아래와 같이 3개의 fixed effect regression 식을 구성하였다.
분석 결과는 다음과 같다. 아래 표에는 총 50개의 토픽에 해당하는 독립변수의 계수를 3개 모델에 대해서 각각 살펴볼 수 있다. 이 연구에서는 전반적으로 각 construct가 어떤 경향이 있는지를 위주로 해석하였다. 가설 1,2,3,5는 유의한 결과가 나타났고 가설4는 혼합된 결과가 나타났다.
📚 장점 및 의의
• 텍스트 마이닝 기법인 LDA를 단순 descriptive analysis 목적으로 사용하지 않고, 유의미한 해석을 도출하였다는 점이 인상깊었다. 토픽모델링 결과를 독립변수로 사용하여 유저들의 engagement를 측정한 부분은 참신한 접근이라는 생각이 든다.
• 대규모의 텍스트 데이터를 단순 예측 목적으로 사용한 것이 아니라, 분석 결과를 통해서 개념적 정립을 시도함으로써 학술적인 시사점을 제공하고자 하였다.
📚 한계점 및 추가 연구 아이디어
• 전반적으로 각 연구의 진행 단계에서 연구자의 자의적인 판단이 많이 개입되었다. 토픽모델링 과정에서 20~80개의 토픽을 여러 명의 연구자가 검토하면서 적절한 수를 선정하고, 관련 construct와 연결할 때에도 여러 연구자가 모여서 판단하였다. 정성적인 해석을 통해서 보다 유의한 결과를 도출할 수는 있으나, 그만큼 주관적 해석이 많이 포함되어 있어서 일반화 가능성이 부족하다고 지적할 수 있따.
• fixed effect regression의 해석에서도 엄격하지 못한 부분이 있다. 동일한 construct에 해당하더라도 토픽별 변수마다 결과가 다르게 나타난 경우도 있으며, 하나의 독립변수(토픽)에 대해서도 model 1,2,3의 결과가 일치하지 않는 경우도 많다. 본 연구에서는 가설과 일치하는 방향으로 결과가 나타난 경우만 해석을 하여서 엄격하게 올바른 해석을 했다고 보기는 한계가 있다.
댓글