摘要 | 第1-5页 |
ABSTRACT | 第5-10页 |
1、选题的背景、价值 | 第10-13页 |
·选题背景 | 第10-11页 |
·本研究的价值 | 第11-13页 |
2、国内外研究现状综述 | 第13-26页 |
·人物简历信息抽取的研究现状 | 第13-16页 |
·信息抽取研究综述 | 第16-24页 |
·命名实体识别研究综述 | 第24-26页 |
3、含人物简历信息的文本分类 | 第26-32页 |
·简历和非简历文本 | 第26-28页 |
·含人物简历信息的文本的分类 | 第28-29页 |
·简历信息抽取项目的确定 | 第29-32页 |
4、简历信息抽取的基本流程 | 第32-34页 |
5、语料的标注 | 第34-42页 |
·语料的选择 | 第34-35页 |
·训练语料库的形成 | 第35页 |
·分词和数据预处理 | 第35-38页 |
·标注的内容 | 第38-42页 |
6、知识库的形成 | 第42-52页 |
·简历信息触发词列表的形成 | 第43-44页 |
·OC_P前接成分表的形成 | 第44-47页 |
·OC_P指示成分列表的形成 | 第47-51页 |
·并列人名的提取规则 | 第51-52页 |
7、简历信息抽取的方法和职衔信息抽取的计算机实现 | 第52-58页 |
·简历信息抽取方法概述 | 第52-55页 |
·职衔信息对抽取的计算机实现 | 第55-58页 |
8、实验结果 | 第58-62页 |
·提取的准确率、召回率 | 第58页 |
·错误分析 | 第58-62页 |
9、结论及展望 | 第62-64页 |
·论文工作小结 | 第62页 |
·不足和展望 | 第62-64页 |
参考文献 | 第64-66页 |
附录 | 第66-77页 |
附录1:分词软件词性和标注符号对应表 | 第66页 |
附录2:日本姓氏表前100 | 第66-67页 |
附录3:组成OC_P的动词表 | 第67页 |
附录4:表示“担任”义的动词表 | 第67页 |
附录5:职衔词语表前100举例 | 第67-69页 |
附录6:年龄和出生日期信息触发词表 | 第69页 |
附录7:性别信息触发词表举例(男性女性各50) | 第69-70页 |
附录8:毕业院校信息触发词表 | 第70页 |
附录9:受处罚信息触发词表 | 第70页 |
附录10:家庭关系信息触发词表前100举例 | 第70-71页 |
附录11:享年和卒年信息触发词表 | 第71页 |
附录12:所得荣誉信息触发词列表 | 第71页 |
附录13:专业信息触发词表 | 第71-72页 |
附录14:学历信息触发词表 | 第72-73页 |
附录15:籍贯和出生地、政治面貌、作品信息触发词表 | 第73页 |
附录16:婚否信息触发词表 | 第73页 |
附录17:民族信息触发词表前100举例 | 第73-75页 |
附录18:宗教信息触发词表前100举例 | 第75-77页 |
致谢 | 第77页 |