求大神...java里面怎么实现智能读取简历...(word格式的简历)

求有哪些大神有着方面的经验的...跪求! 满意的话 分数全给了...小弟十分想学习一下,想那些大型招聘网站上面是怎么智能读取用户上传的简历的...!真心跪求!!!哪怕是一点点的也希望能提供给我....万分感谢!
能够智能抓取里面的关键字段就行了...

网站上的模板都是固定格式,简历里的信息是存放到数据库里的,在显示简历的时候从数据库里取出来,按照固定格式生成DOC文档。 如果用户上传一个自己模板的简历,网站的程序一样不能从上传的简历中读取相应信息的。除非你是按照他规定的格式,并且网站后台有这样的功能。

我们做过农行的托管报告, 用得方法是 设置标签, 命名为name 那么程序读到这个标签的时候这个标签后面就是你的姓名, 标签 age 后面就是你的年龄 这样比较灵活一点 。
另外一种方法是固定格式 比如第一行 姓名 性别 年龄 第二行 籍贯 第三行 工作经历 等等追问

其实我就是要做一个用户随便上传一个简历,然后我能读取到简历里面我想要的信息,然后填充到页面或者保存到DB,重要的是第二步,其他的都没问题,给点意见,哥们

追答

建议你提供一个模板给用户下载,用户在下载的模板里填数据。 这样你根据你的模板来获取数据

追问

嗯,如果是这样的话就不会来百度问了,哈哈,不过真心谢谢你哈😄

温馨提示:答案为网友推荐,仅供参考
第1个回答  2014-01-02
java处理word文档的开源的我知道两个,一个是Apache的POI,这个挺好用的,我只用过它处理过Excel文件,我想word应该也不难吧,还有一个是OpenOffice的Api这个你也可以尝试一下,不过这个Api貌似不如Poi好用,我当时用它的时候,资料很难找。追问

API什么的应该都没问题,只是想知道有什么方式智能抓取Word里面的某些数据~,就比如说,别人上传的简历模板都不一样,但是我需要从里面抓取自己想要的信息,不知道大型招聘网站是怎样做的~有没有什么一套规则之类的~

第2个回答  2014-01-02
用分词器分析, 比如:Lucence的中文分析器. 然后用hash统计频率, 排序后就是你要的.追问

哥们,解析一份简单的Word,不需要用到搜索引擎吧,😊

第3个回答  2017-10-26
请问下,楼主找到合适的方式了么?我现在也有类似你这样的需求,找了模式识别方面的资料,有点复杂
第4个回答  2014-01-19
你可以试试PageOffice,软件包里好像有你需要的例子,要不问问他们技术支持
相似回答