北森

公司动态

【招聘系统升级】简历体验三剑客之“解析技术”

2015-11-164533

  招聘管理系统基础的功能无外乎简历管理或者渠道整合,这其中都离不开对简历的处理。北森简历局在简历的实际场景综合考量之上,通过对HR、面试官等使用简历的行为进行细致的分析,对简历使用制定了一个完整的解决方案,总结起来就是简历应用三个使用场景: 解析、阅读、搜索,既简历体验三剑客。给大家带来的是简历体验三剑客之"简历解析"。

 

  简历通常有两种类型,一是来自于招聘网站的标准格式的简历,二是来自于猎头、内部推荐等渠道的纯WORD、PDF简历。前者有标准格式,后者没有标准格式。在北森的简历解析技术中分别对应使用:“模板解析“和”纯文本解析“两种技术。

 

  模板解析

 

  招聘网站通过采用标准在线简历,即有非常明确的样式和结构特征,且在一段时间内结构稳定。对于这样的简历,简历局采用“模板解析”技术处理——主要针对各大招聘网站的标准简历格式、字段、文档特征进行识别、匹配、映射和解析。在模板解析识别中涉及到:

 

  1.渠道特征库:

 

  目前在北森的招聘管理系统中,对超过100家的简历特征进行了分析和提取特征。对这类渠道的简历,进入系统的时候我们就能准确的识别这份简历属于何种渠道。

 

  2.文档结构特征库:

 

  在基于渠道特征识别的基础上,简历局对渠道内的简历文档结构特征建模,对已经建立特征的简历可以做到”匹配“,对此类简历内容的识别,北森可以做到98%以上的识别率。

 

  3.常量映射特征库

 

  同时,为了让HR在筛选中使用结构化的数据,我们也对大部分的渠道简历常量进行了映射和匹配。

  

1.jpg


  说到这里似乎标准网站的简历处理话题应该结束了。实际上,各个招聘网站出于自己的业务需求也会经常变简历模板甚至常量的分类,这就会简历解析效果提出了挑战。为了应对这个问题,北森简历局开发了“模板解析快速特征识别学习平台”。在基于以上特征库的基础上,我们推出“特征变预警”、“在线模板快速学习”、“变后简历重新解析“三项工具,对招聘渠道的简历特征变可以提前预警,预警后可以进行快速模板学习,并将模板变后的简历进行重新识别和解析,以保证用户正常使用。

  

2.jpg


  纯文本解析

 

  除了来自招聘网站的标准简历,还存着在一大批应聘者自己撰写的个性化简历。应对这类简历,模板解析技术就不灵了,要使用“纯文本解析”技术。纯文本解析通常使用于非渠道、或者渠道简历无明显特征、文档格式不够标准。人阅读简历时一眼可以看懂的信息,计算机的学习就需要大量的规则和算法。就拿简历局近一次升级的纯文本解析技术来讲,主要涉及以下方面:

 

  1.文档结构的分析、识别

 

  文档结构分析识别引入了多专家决策和智能判定机制,区块识别准确,可以准确识别超过85%的简历区块信息$2例如教育背景等$3。

 

  2.增强NLP处理模块

 

  NLP处理模块对序列标注、专业词库分级等进行了算法优化和提升。尤其是专业词库的分级和聚类算法有大幅度提升。

 

  3.机器学习机制$2Mr.R$3

 

  是的,这是这次升级的重点,Mr.R 是简历智能学习机器人Mr. Robot,也是简历解析的Mr.Right。简单讲: Mr.R可以自己学习、默默读书了...通过机器学习技术,我们解决了简历特征数据的自主学习,其次解决了如何让计算机知道”这次简历解析是好还是坏。

 

  通过此次升级,我们纯文本解析的识别率提高到了大约90%,同时也推出了重磅的“定向学习”功能。

 

  什么是定向学习:在引进机器学习的基础上,我们的简历解析可以做到“定向优化、自主学习“,譬如某特殊行业客户简历识别率不高,没关系,让我们的Mr.R学习一下,解析率瞬间爆表!

 

  结语

 

  只为用户获得顺畅的阅读体验、完美解析结果、懂你的搜索,这是北森“简历局”的使命,尽请期待下一期《简历体验三剑客之简历阅读》。


多招聘云相关信息请点击:北森招聘云

相关动态
查看更多相关动态
咨询电话申请演示

联系北森

售前产品咨询

400-650-6878

售后服务支持

400-650-6886

关注北森

北森官方人才管理研究院

©2002-2020 北京北森云计算股份有限公司版权所有 京ICP备05051632号 京公网安备 11010802020454号