📚 논문 정보
오소진, 장문경, & 송희석. (2021). 양방향 인재매칭을 위한 BERT 기반의 전이학습 모델. Journal of Information Technology Applications & Management, 28(4), 33-43.
📚 요약
본 연구에서는 국내 헤드헌처 업체의 구직자 프로필, 채용 공고, 지원 이력에 대한 데이터를 사용했다. 또한 해당 데이터에는 지원자의 지원여부를 나타내는 binary 데이터와, 긍정사례 17,995건 / 부정사례 42,367건으로 나뉘어져 있다. 이 변수를 기준으로 해당 구직자가 채용 공고에 적합한 지 여부를 학습했다.
이 연구에서 제안한 BERT 기반 모델의 프레임워크는 위와 같다.
• 구직자의 프로필과 채용공고를 BERT 모델에 입력하기 위해서 데이터 전처리를 실시한다.
→ Tokenize, Token Embeddings, Segment Enbeddings, Position Embeddings
• 구직자 프로필과 채용공고를 컬럼으로 변환하고 concat 한다
• concat한 데이터를 BertTokenizer를 이용하여 토큰 형태로 분리한다.
• 토큰 임베딩을 통해서 고유 ID / Segment Embeddings / Position Embedding을 부여한다.
• 처리한 데이터를 모델에 입력한다.
모델 성능 평가를 위한 벤치마크 모델은 이전 연구에서 제시된 내용기반 척도학습 모형(CBML)로 설정했다. 실험 결과 모든 지표에서 본 연구에서 제시한 BERT 모델의 성능이 높게 나타났다.
📚 장점 및 의의
• 연구 주제, 분석 기법, 데이터셋 등 여러 요소에서 실제 논문 작성에 배울 점이 많았다. 인재 매칭이라는 주제도 시의 적절하게 잘 선택되었으며, BERT를 분석 기법으로 사용한것도 트렌디한 방식이라고 생각한다. 그리고 무엇보다 좋은 데이터를 적절하게 잘 활용하였다.
• 이 연구에서는 구직자 프로필과 채용공고의 내용을 합쳐서 BERT의 input 으로 사용하였다.
다른 도메인이나 컨텍스트의 데이터를 이런 방식으로 다뤄서 BERT 모델을 활용할 ?
ex) 유저의 리뷰와 상품의 설명
📚 한계점 및 추가 연구 아이디어
• 이 연구가 가지는 특징 또는 독창성이 부족하다는 생각이 들었다. 물론 BERT가 다양한 연구에서 활용되고 성능이 좋은 모델인 것은 맞지만, 이 연구에서는 주어진 데이터에 BERT 모델을 사용함으로써 기존 연구의 한계점을 개선했다고 주장한다. 다른 도메인 데이터에 새로운 기법을 단순 적용해서 제시한 것은 아쉬운 지점이었다.
'논문 리뷰 > 추천시스템' 카테고리의 다른 글
[추천시스템] 딥러닝을 이용한 온라인 리뷰 기반 다속성별 추천 모형 개발 (0) | 2022.03.12 |
---|---|
[추천시스템] 개인화 추천시스템에서 고객 제품 리뷰가 사회적 실재감에 미치는 영향 (0) | 2022.03.07 |
[추천시스템] 추천 수량과 재 추천을 고려한 사용자 기반 협업필터링 추천시스템 (0) | 2022.02.21 |
[추천시스템] 추천시스템 기법 연구동향 분석 (0) | 2022.02.09 |
[추천시스템] 개인화 서비스 진전에 따른 자동추천 시스템 연구 동향과 방법론적 특성 연구 (0) | 2022.02.02 |
댓글