[AI 모델 탐험기] #8 이력서 생성 모델

AI Network
11 min readMay 24, 2021

--

[편집자주] 본 글은 커먼컴퓨터에서 Developer Relations Engineer를 맡고 있는 성창엽님이 오픈소스 AI모델을 정리하고 인사이트를 공유하는 글로 시리즈로 기획돼 발행되고 있습니다. 여덟번째 글은 이력서에 대한 글입니다. 이 글은 커먼컴퓨터 엔지니어 이은지님께서 작성하신 글을 블로그 형태에 맞게 수정한 글입니다.

제가 오늘 소개드릴 모델은 단어 몇 개만 입력하면 이력서를 생성해주는 모델입니다.

프로젝트를 바로 확인해 보고 싶으신 분들은 다음 링크를 참조해주세요.

Demo : https://link.ainize.ai/3unEojv

API : https://link.ainize.ai/2Sm7thC

Github : https://link.ainize.ai/3oJh1zl

이력서 : 취직을 위한 면접의 기회를 얻기 위해 회사 등 조직에 제출하는 개인의 신상정보, 학력, 경력 등을 시간 순으로 요악 혹은 나열한 문서

만약 취업이나 이직을 준비하고 계시다면 이력서 쓰기는 피할 수 없습니다. 인사 담당자들은 수많은 지원자들의 이력서를 보기 때문에 지금까지의 자신만의 이력과 성취에 대해서 잘 설명해야 합니다. 지금까지 코드와 고군분투하며 살아왔지만, 막상 이력서를 쓰려면 무얼, 어떻게 쓸지 막막해지기 쉽습니다.

이처럼 코드 짜기보다 자신을 소개하는 글쓰기가 더 어려운 개발자들을 위해 이력서 생성 모델을 소개해 드리려고 합니다.

이력서

모델 학습에 사용된 이력서 데이터는 Kaggle에서 구할 수 있었습니다. 해당 데이터에는 Java Developer, DevOps Engineer 등 다양한 분야의 이력서들이 포함되어 있습니다.

첫번째 이력서를 살펴보겠습니다.

"Skills * Programming Languages: Python (pandas, numpy, scipy, scikit-learn, matplotlib), Sql, Java, JavaScript/JQuery. * Machine learning: Regression, SVM, Na횄짱ve Bayes, KNN, Random Forest, Decision Trees, Boosting techniques, Cluster Analysis, Word Embedding, Sentiment Analysis, Natural Language processing, Dimensionality reduction, Topic Modelling (LDA, NMF), PCA & Neural Nets. * Database Visualizations: Mysql, SqlServer, Cassandra, Hbase, ElasticSearch D3.js, DC.js, Plotly, kibana, matplotlib, ggplot, Tableau. * Others: Regular Expression, HTML, CSS, Angular 6, Logstash, Kafka, Python Flask, Git, Docker, computer vision - Open CV and understanding of Deep learning.Education Details 

Data Science Assurance Associate

Data Science Assurance Associate - Ernst & Young LLP
Skill Details
JAVASCRIPT- Experience - 24 months
jQuery- Experience - 24 months
Python- Experience - 24 monthsCompany Details
.
.
.
MULTIPLE DATA SCIENCE AND ANALYTIC PROJECTS (USA CLIENTS)
TEXT ANALYTICS - MOTOR VEHICLE CUSTOMER REVIEW DATA * Received customer feedback survey data for past one year. Performed sentiment (Positive, Negative & Neutral) and time series analysis on customer comments across all 4 categories.
* Created heat map of terms by survey category based on frequency of words * Extracted Positive and Negative words across all the Survey categories and plotted Word cloud.
* Created customized tableau dashboards for effective reporting and visualizations.
CHATBOT * Developed a user friendly chatbot for one of our Products which handle simple questions about hours of operation, reservation options and so on.
* This chat bot serves entire product related questions. Giving overview of tool via QA platform and also give recommendation responses so that user question to build chain of relevant answer.
* This too has intelligence to build the pipeline of questions as per user requirement and asks the relevant /recommended questions.
.
.
.
창짖 FAP is a Fraud Analytics and investigative platform with inbuilt case manager and suite of Analytics for various ERP systems.
* It can be used by clients to interrogate their Accounting systems for identifying the anomalies which can be indicators of fraud by running advanced analytics
Tools & Technologies: HTML, JavaScript, SqlServer, JQuery, CSS, Bootstrap, Node.js, D3.js, DC.js"

데이터를 살펴보니 항목을 나타내는 *을 제거하고, 인코딩 에러가 발생하는 단어를 삭제해야 할 거 같습니다. 또한 데이터에는 개발자 이력서만 있는 것이 아니라 HR(Human Resource), Mechanical Engineer 등의 이력서가 포함되어 있어 이를 필터링 해주는 과정이 필요합니다.

나만의 이력서를 만들어보자

  • Demo 사용하기

우선 Ainize가 제공하는 DEMO를 통해 이력서를 만들어 보겠습니다.

Base text를 입력 후 버튼을 누르면 이력서 생성 결과를 확인해볼 수 있습니다. 해당 Demo는 link에서 확인할 수 있습니다.

  • API 사용하기

이번에는 Ainize에서 제공하는 API를 사용하여 이력서를 작성 해보겠습니다. API에 관한 내용은 link에서 확인할 수 있습니다.

text_input를 입력후 length를 설정하면 이력서를 만들어 볼 수 있습니다. 단, length를 너무 크게 잡으면 오류가 발생하니 유의해주세요(길이는 10~30정도가 적당한 거 같습니다).

  • 직접 모델을 학습하기

이번에는 Teachable NLP를 통해 모델을 학습하여 모델을 사용해보겠습니다.

Teachable NLP는 NLP 모델들을 복잡한 코드, GPU 없이 fine-tuning 할 수 있게 도와주는 프로그램입니다. 누구든지 학습에 사용할 데이터만 업로드하면 모델이 자동적으로 학습되고, API 형태로 배포되는데 이 API를 통해 모델을 사용할 수 있습니다.

Teachable-NLP에서 전처리 과정을 마친 데이터를 넣고 Model size는 Small 로, epoch는 3로 설정한 뒤 GPT-2 모델을 Fine-tuning 하였습니다. 트레이닝 과정이 종료되면, Test your model 을 클릭합니다. 클릭하면 열리는 TabTab 화면에서 나만의 이력서를 만들어 볼 수 있습니다.

이력서를 작성하는 것은 쉬운 일이 아닌 거 같습니다. 저도 처음에 이력서를 작성할 때 어떤 내용을 적어야할 지 모르겠어서 어려움을 겪은 경험이 있습니다. 이 모델을 빨리 알았다면 이력서를 쓰는데 보다 수월했을 거 같다는 생각이 듭니다.

이런 모델을 취업 지원 서비스에서 제공해준다면 모델 학습에 사용할 이력서를 구하기도 쉽고(개인정보 문제를 해결했다는 전재하에) 더욱 서비스를 찾는 사람이 많아지지 않을까?라는 생각을 하며 글을 마무리 하겠습니다. 읽어주셔서 감사합니다!

레퍼런스

  1. 이력서 위키백과
  2. Resume Dataset
  3. Resume Model Github
  4. Resume Model Ainize
  5. Teachable NLP

지난 글 다시 보기

AI 네트워크는 블록체인 기반 플랫폼으로 인공지능 개발 환경의 혁신을 목표로 하고 있습니다. 수백만 개의 오픈 소스 프로젝트가 라이브로 구현되는 글로벌 백엔드 인프라를 표방합니다.

최신 소식이 궁금하시다면 아래 커뮤니케이션 채널을 참고해주시기 바랍니다. 다시 한 번 감사합니다.

​AI네트워크 공식 홈페이지: https://ainetwork.ai/

공식 텔레그램: telegram.com/ainetwork_kr

아이나이즈(Ainize): https://ainize.ai

유튜브: https://www.youtube.com/channel/UCnyBeZ5iEdlKrAcfNbZ-wog

페이스북:https://www.facebook.com/ainetworkofficial/

포럼:https://forum.ainetwork.ai/

AIN Price chart: https://coinmarketcap.com/currencies/ai-network/onchain-analysis/

--

--

AI Network
AI Network

Written by AI Network

A decentralized AI development ecosystem built on its own blockchain, AI Network seeks to become the “Internet for AI” in the Web3 era.

No responses yet