面向列表型知识库的组织机构实体链接方法研究

摘要	第5-6页
Abstract	第6页
第1章绪论	第9-14页
1.1 研究背景	第9页
1.2 本文研究的内容与挑战	第9-10页
1.3 研究意义	第10-11页
1.4 本文方法概要	第11-12页
1.5 论文内容安排	第12-14页
第2章相关工作	第14-23页
2.1 实体链接	第14-17页
2.1.1 实体链接基本概念	第14-15页
2.1.2 实体链接的国内外研究现状	第15-17页
2.2 组织机构命名实体识别	第17-20页
2.2.1 基于规则的方法	第17-18页
2.2.2 基于统计的方法	第18-20页
2.3 中文分词	第20-22页
2.4 本章小结	第22-23页
第3章组织机构名称简称的生成	第23-32页
3.1 组织机构名称的组成成分与结构	第23-25页
3.2 组织机构名的分词与标注	第25-30页
3.2.1 收集常用词	第25-26页
3.2.2 基于双向最大匹配的组织机构名的分词方法	第26-28页
3.2.3 分词结果中各个成分的标注	第28-30页
3.3 生成简称	第30-31页
3.4 本章小结	第31-32页
第4章组织机构实体链接方法	第32-39页
4.1 识别指称项	第32-33页
4.2 获取实体候选集	第33-34页
4.3 确定链接与消除歧义	第34-38页
4.3.1 候选集中实体的排序方法	第34-35页
4.3.2 两阶段的组织机构实体链接方法	第35-38页
4.4 本章小结	第38-39页
第5章实验结果与分析	第39-49页
5.1 中文组织机构名称的分词与标注实验结果	第39-43页
5.1.1 数据介绍	第39页
5.1.2 自然语言处理工具的测试结果对比	第39-40页
5.1.3 中文组织机构名常用词收集结果	第40-43页
5.1.4 组织机构名分词方法和标注方法结果	第43页
5.2 公安询问笔录组织机构实体链接实验	第43-47页
5.3 新华网产经新闻实体链接实验	第47-48页
5.4 本章小结	第48-49页
第6章总结与展望	第49-52页
6.1 本文工作总结	第49-50页
6.2 未来研究展望	第50-52页
6.2.1 本文方法的进一步讨论	第50页
6.2.2 从实体链接到命名实体识别	第50-52页
参考文献	第52-57页
致谢	第57-58页
攻读硕士期间发表的学术论文	第58页