java简历解析

一、分析提取思路

1、简历模版类别,横版和竖版

横版

竖版

2、简历可以是图片,word文档,pdf文档,大致三种情况

3、先从上面的文件里提取全部文本内容

提取文本比较简单,但是要寻找提取率比较高的技术

4、文本内容大致划分模块

总体上简历都是按模块划分,比如工作经历,教育背景等

可先从整体内容划分成模块内容

5、模块内容整体划分

比如工作经历模块内容,含有时间,公司,项目,岗位等,可根据规律或者词性等来进行提取

目前研究的提取结果,准确率仍需提升

猜你喜欢

转载自blog.csdn.net/qq_38623939/article/details/128240093
今日推荐