Recruit Automation with Deep Learning (IBM, Paper, Slide, adroitbot)

1. 서론 

Recruit 자동화는 지금까지 자료를 찾은 결과를 종합하였을 때 HR Recruiting 의 자동화는 로보 어드바이져와 마찬가지로 시스템 구성의 성격이 더 강하다. Skill-Set 일치 비교(유사어 처리, 카테고리화), Semantic analysis, 성향 분석, Summary 등을 수행후 종합적인 Scoring 과 Summary View 를 Guidance 로 제공 등 세부 Task 들의 집합으로 볼 수 있겠다.

(1) 1세대 시스템
신문, 광고 등으로 채용공고를 진행하고 관심있는 지원자가 이력서를 작성해서 요청하면, 심사를 진행하여 채용하는 형태

(2) 2세대 시스템
중간에 에이젼트를 두고 정해진 Format 으로 이력을 작성하면, 관심있는 기업과 연결해주는 형태  (이력서 Format 이 고정적)

(3) 3세대 시스템
지원자가 아주 Free 한 형태로 내용을 작성하면,  AI 시스템이 필요한 정보들을 추출하고 Index화여 주는 형태. 지원자 정보 입수 Pool 을 SNS, LinkedIn, Github 등 다양한 형태로 사용할 수 있음
즉, 더 많은 대상을 상대로 채용 기회를 Push 할 수 있는 장점
※ 여기에 Filtering Process 를 고도화/자동화 하기 위한 Idea 필요

2. 주요 요소

(1) 원하는 지원자를 명확히 정의하는 일
– 요청하는 포지션의 정보를 명확히 정의할 필요
– 원하는 개인의 성향을 명확히 정의할 필요
– 요청 포지션의 우수 직원의 Factor 를 명확히 정의 필요
=> 시스템화를 하여 포지션 별 선정 기준 관리 필요

(2) 사용자의 정보에서 Factor 를 추출하는 일
– Free Format 에서 원하는 정보를 추출하여 Organize 하는 작업
– 개인이 작성한 글들을 기반으로 Insight 를 줄 수 있는 정보 도출
=> 자연어 처리 기술을 (AI) 를 활용할 부분이 많음

(3) Resume Ranking (Skill Set, 성향, 우수직원과 비교)
– 원하는 기준과 비교를 통한 Ranking 도출
– Ranking 도출 자체도 Rule Base 혹은 ML Base 가 될 수 있음
=> 1,2 가 만족되면 자동화, 시각화 할 수 있는 요소가 많음

3. 원하는 지원자를 정의하는 일 (평가하고자 하는 Factor 를 도출 필요) 

(1) 자기 소개서 문항 설계
AI 를 활용한 자동 Ranking 및 분석을 활용하고자 한다면, 자소서 문항부터 우리가 지원자들에게서 알고 싶은것이 무엇인지 명확하게 하고, 그러한 내용들이 입력되도록 유도할 필요가 있다. 예를들어서 안정적인 직장을 추구하는 사람인지, 도전적인 일과 자신의 발전을 추구하는 사람인지를 판단하고 싶다면, 그와 해당된 질의 문항을 만들고 해당 목록 (예 500자) 내용을 분류하는 AI(인공지능) 모델을 만들어서 적용하는 방식이 될 것이다.


예를 들면 위의 5개 항목에 해당되는 5개의 AI 모델을 만들고 해당 모델들을 통해서 항목별로 ‘가치관’, ‘애사심’, ‘진취성’, ‘경험’,’비전’이라는 형태로 Context 를 기반으로 분류를 해내고 실제 심사관들이 참조 할 수 있도록 하는 형태가 될 것이다.

(2) 평가 항목 설계
그외에 평가하고자 하는 항목을 설계할 필요가 있다. 예를 들면 아래와 같은 항목들이 있을 수 있겠다.

1)Current Compensation
2)Expected Compensation
3)Education
4)Specialization
5)Location
6)Earliest Start Date
7)Total Experience
8)Relevant Experience
9)Communication
10)Current Employer
11)Stability
12)Education Gap
13)Work Gap.

(3) 우수 직원 (Best Practice) 요소 설계
직군별 우수 직원 설계는 모두 수작업으로 해야할 필요가 있으며, 그 항목은 (1),(2)와 일치해야 한다. 직군별 우수 직원에 대한 조사를 통해 (동일한 이력서를 작성하게 한다던지) 비교군을 만들어낼 필요가 있다. 그 후에는 해당 직군별 우수 직원과 입사 지원자의 유사도라는 형태로 Factor 를 뽑아낼 수 있을 것이다.

4. 지원자로 부터 정보를 추출하는 일 (지원 포맷 or SNS 등) 

(1) 자기 소개서
우리가 지정한 포맷에 사용자가 입력하도록 한다면 손쉬운 수집 방법이 될 수 있으나, 모수를 확보하는 것이 한정적이 될 수 있다

(2) LinkedIn , GitHub, Blog, FaceBook 등
비정형 데이터에서 개인의 성향 및 관심 분야를 도출해 내는 것은 단순히 자기소개에서 입력하도록 하는 것보다 훨씬 심층적이고 정확한 개인의 성향을 분석해 낼 수 있다

5. Mapping (Skill Set, 성향 등.. ) And Scoring  

(1) 키워드 비교
Word Embedding 기법을 활용하여 단순히 키워드 맵핑이 아닌 의미적인 유사성을 비교할 필요가 있으며, 관련 기법으로는 W2V, FastTet, Glove 및 Doc2Vec 관련 기술들이 있다.

(2) Text Classification
문장의 분류 및 감정 분석 분야에서 딥러닝은 기존의 단순한  키워드 맵핑보다 더 Semantic 한 분석이 가능하다는 점에서 많은 연구가 이루어 지고 있으며, 최근에는 CNN 활용한 기법 및 Attention 메커니즘을 활용한 Memory Net 을 넘어서 Reasoning 을 목표로 하는 MRC (ReasoNet) 등 다양한 연구가 이루어 지고 있어 인공지능(AI) 를 적용해 볼만한 가치가 있는 부분으로 보인다.

(3) NER (Named Entity Recognition) & SRL (Semantic Role Labeling)
Free 한 Document 에서 정보를 추출하기 위한 방법에서도 기존의 방법론 보다 딥러닝 기법이 월등함을 보이고 있으며, 대표적으로 BilstmCrf 과 같은 방법들이 있다. 추가적으로 Ontology 형태로 데이터를 관리하기 위한 Graph DB 및 SRL 기술도 필요하다

(4) Scoring 모델
1,2,3 에서 추출된 요소를 기반으로 지원자의 Ranking 을 도출하기 위한 ML 혹은  DL 기반의 모델링이 필요할 수 있다. 혹은 간단하게 Rule 로 해결할 수도 있는 부분이 될 수 있다.

Categories: Paper Study

Leave a Reply

Your email address will not be published. Required fields are marked *