본문 바로가기
논문 리뷰/추천시스템

[추천시스템] 양방향 인재매칭을 위한 BERT 기반의 전이학습 모델

by 장찐 2022. 2. 25.

📚 논문 정보 

오소진, 장문경, & 송희석. (2021). 양방향 인재매칭을 위한 BERT 기반의 전이학습 모델. Journal of Information Technology Applications & Management, 28(4), 33-43.

 


📚 요약 

 

 본 연구에서는 국내 헤드헌처 업체의 구직자 프로필, 채용 공고, 지원 이력에 대한 데이터를 사용했다. 또한 해당 데이터에는 지원자의 지원여부를 나타내는 binary 데이터와, 긍정사례 17,995건 / 부정사례 42,367건으로 나뉘어져 있다. 이 변수를 기준으로 해당 구직자가 채용 공고에 적합한 지 여부를 학습했다. 

 이 연구에서 제안한 BERT 기반 모델의 프레임워크는 위와 같다. 

 

• 구직자의 프로필과 채용공고를 BERT 모델에 입력하기 위해서 데이터 전처리를 실시한다. 

→ Tokenize, Token Embeddings, Segment Enbeddings, Position Embeddings

 

• 구직자 프로필과 채용공고를 컬럼으로 변환하고 concat 한다 

 

• concat한 데이터를 BertTokenizer를 이용하여 토큰 형태로 분리한다. 

 

• 토큰 임베딩을 통해서 고유 ID / Segment Embeddings / Position Embedding을 부여한다. 

 

• 처리한 데이터를 모델에 입력한다. 

 

 

 모델 성능 평가를 위한 벤치마크 모델은 이전 연구에서 제시된 내용기반 척도학습 모형(CBML)로 설정했다. 실험 결과 모든 지표에서 본 연구에서 제시한 BERT 모델의 성능이 높게 나타났다. 

 


📚 장점 및 의의 

• 연구 주제, 분석 기법, 데이터셋 등 여러 요소에서 실제 논문 작성에 배울 점이 많았다. 인재 매칭이라는 주제도 시의 적절하게 잘 선택되었으며, BERT를 분석 기법으로 사용한것도 트렌디한 방식이라고 생각한다. 그리고 무엇보다 좋은 데이터를 적절하게 잘 활용하였다. 

 

• 이 연구에서는 구직자 프로필과 채용공고의 내용을 합쳐서 BERT의 input 으로 사용하였다.

다른 도메인이나 컨텍스트의 데이터를 이런 방식으로 다뤄서 BERT 모델을 활용할 ? 

ex) 유저의 리뷰와 상품의 설명 

 


 

📚 한계점 및 추가 연구 아이디어 

• 이 연구가 가지는 특징 또는 독창성이 부족하다는 생각이 들었다. 물론 BERT가 다양한 연구에서 활용되고 성능이 좋은 모델인 것은 맞지만, 이 연구에서는 주어진 데이터에 BERT 모델을 사용함으로써 기존 연구의 한계점을 개선했다고 주장한다. 다른 도메인 데이터에 새로운 기법을 단순 적용해서 제시한 것은 아쉬운 지점이었다. 

 

 

댓글