본문 바로가기

전체 글184

[머신러닝] Fake News, Investor Attention, and Market Reaction 📚 논문 정보 Clarke, J., Chen, H., Du, D., & Hu, Y. J. (2020). Fake news, investor attention, and market reaction. Information Systems Research, 32(1), 35-52. 📚 요약 이 논문에서는 가짜 뉴스가 투자자와 시장에 미치는 영향을 분석하였다. SEC를 통해서 가짜 뉴스로 분류된 뉴스와 Seeking Alpha의 뉴스를 비교분석 하였다. 연구 진행을 위해서 SEC가 분류한 383개의 가짜 뉴스, 157,000개의 진짜 뉴스, 그리고 그와 관련된 정보들(댓글, 조회수 등)을 수집하였다. Investor attention 측면에서 가짜 뉴스는 page view, 기사 완독 횟수가 더 높다는 것을 알 .. 2022. 5. 19.
[머신러닝] Does Machine Translation Affect International Trade? Evidence from a Large Digital Platform 📚 논문 정보 Brynjolfsson, E., Hui, X., & Liu, M. (2019). Does machine translation affect international trade? Evidence from a large digital platform. Management Science, 65(12), 5449-5460. 📚 요약 본 연구에서는 eBay의 Machine Translation 시스템이 수출량 증가에 미치는 영향을 연구하였다. MT 시스템의 영향을 정확하게 파악하기 위하여, 여러 상황을 가정하고 변수를 통제하였다. 번역 모델을 도입한 이후에 나타나는 변화를 DID방법을 사용하였는데, 종속변수로는 각 국가별 매출을 사용하였고 독립변수로는 번역 기능 도입 여부와 관련된 변수들을 사용하였다.. 2022. 5. 19.
[Mixed Method] 사이버비행 요인 파악 및 예측모델 개발 : 혼합방법론 접근 📚 논문 정보 손새아, 신우식, & 김희웅. (2021). 사이버비행 요인 파악 및 예측모델 개발: 혼합방법론 접근. 정보시스템연구, 30(2), 29-56. 📚 요약 청소년의 사이버 비행으로 인한 피해가 커지면서 심각한 사회적 문제로 대두되고 있다. 이 연구에서는 사이버 비행의 요인을 탐색하고, 사이버 비행 가해자 예측 모델을 구축해서 범죄를 예방하는 것을 목적으로 한다. 청소년 사이버비행을 설명하기 위해서 이 연구에서는 일반긴장이론, 사회학습이론, 사회유대이론, 일상행위이론을 사용하였다. 기존에 이러한 이론을 바탕으로 청소년들의 행동을 분석한 연구들을 많았지만, 대부분 단일 이론을 기반으로 한다. 이 연구는 여러 이론을 사용하여 종합적인 접근을 시도하였다. 이 연구의 전체 분석과정은 위와 같다. 연구.. 2022. 5. 19.
[Mixed method] 이러닝 만족도 증진을 위한 탐색적 연구 : 텍스트 마이닝과 인터뷰 혼합방법론 📚 논문 정보 이순규, 최수빈, & 김희웅. (2019). 이러닝 만족도 증진을 위한 탐색적 연구: 텍스트 마이닝과 인터뷰 혼합방법론. Information Systems Review, 21(1), 39-59. 📚 요약 전 세계적으로 이러닝 시장이 가파르게 성장하고 있지만 사용자들의 이러닝에 대한 만족도는 낮은 실정이다. 이러닝 만족도는 학습자가 지출한 경제적, 시간적, 정신적 비용보다 더 큰 효과를 느끼는 감정을 의미한다. 이 연구에서는 이러닝 학습자들의 만족도 요인을 도출하고 증진 방안을 제시하기 위해서 인터뷰 방법과 텍스트 마이닝을 결합하여 meta inference를 진행하는 혼합방법론을 사용했다. 연구에서 사용된 메인 이론은 ‘정보시스템 성공 모델’로, 시스템 품질 / 정보 품질 / 서비스 품질.. 2022. 5. 19.
나이브 베이즈 (Naive Bayes) 📚 나이브 베이즈 ✅ 기본 개념 • 베이즈 룰을 사용해서 종속변수의 확률을 계산하는 알고리즘이다. 즉, 새로운 관측치에 대해서, "종속변수가 특정 값을 가질 확률"을 학습데이터에서 베이즈 공식을 이용하여 구한다. 일반적으로 확률이 제일 큰 값을 종속 변수의 값으로 선정한다. • 일반 머신러닝 알고리즘과는 다르게 학습 과정이 없기 때문에 별도의 비용함수가 존재하지 않는다. 즉, 학습데이터에 라벨이 관측치들로 확률을 한 번 계산하면 예측값을 도출할 수 있다. • 최근에는 많이 사용되지 않고 벤치마크로 사용하는 경우가 많다. 0,1을 분류하는 문제에서 k개의 피쳐가 있을 때, 종속변수=1일 확률을 아래와 같이 나타낼 수 있다. ✅ 계산 과정 독립변수가 2개, 종속변수는 1 or 0인 경우에 대해서 나이브 베이.. 2022. 5. 15.
영화리뷰 감성분석 (Sentiment Analysis) 📚 감성 분석이란 ✅ 개념 감성분석은 각 문서에 사용된 단어들을 이용하여 해당 문서의 긍정/부정 감성을 파악하는 분석을 의미한다. 감성 분석에는 크게 두 가지 접근방식이 있다. (1) 머신러닝 기반 접근 : 지도학습 (2) Lexicon Based(감성어 사전 기반) 최근에는 머신러닝 기반 감성 분석 방법이 많이 사용된다. 한국어 감성 사전이 존재하기는 하지만 공개되어 있는 사전들은 포함된 단어의 수도 적고 특정 도메인에 특화된 방식으로 생성된 것이 많아서 좋은 성능을 기대하기는 어렵다. 머신러닝으로 지도학습을 하기 위해서는 해당 문서의 감성 라벨링이 되어있어야 하는데, 라벨링 된 채로 공개되는 데이터가 많지 않기 때문에 연구자들이 직접 라벨링을 실시하는 경우도 많다. 머신러닝 알고리즘 중에서 감성 분석.. 2022. 5. 15.