基于维基百科的人物关系抽取研究
致谢 | 第5-6页 |
摘要 | 第6-7页 |
ABSTRACT | 第7-8页 |
1 引言 | 第11-20页 |
1.1 研究背景及意义 | 第11-12页 |
1.1.1 研究背景 | 第11页 |
1.1.2 研究意义 | 第11-12页 |
1.2 国内外研究现状 | 第12-18页 |
1.2.1 信息抽取研究现状 | 第12-15页 |
1.2.2 人物关系抽取研究现状 | 第15-18页 |
1.3 论文主要内容 | 第18页 |
1.4 论文组织结构 | 第18-20页 |
2 相关工作介绍 | 第20-34页 |
2.1 人名实体识别方法 | 第20-23页 |
2.1.1 基于规则和词典的方法 | 第20-21页 |
2.1.2 基于统计的方法 | 第21-22页 |
2.1.3 规则和统计相结合的方法 | 第22-23页 |
2.2 人名实体识别改进实验结果 | 第23-24页 |
2.3 维基百科相关知识介绍 | 第24-34页 |
2.3.1 维基百科及相关知识库介绍 | 第24-26页 |
2.3.2 维基百科结构组成 | 第26-34页 |
3 基于维基百科的人名识别 | 第34-40页 |
3.1 维基百科数据处理 | 第35页 |
3.2 构建基于中文维基百科的人物库 | 第35-38页 |
3.3 构建基于中文维基百科的人名词典 | 第38-39页 |
3.4 实验设计与结果 | 第39页 |
3.5 本章小结 | 第39-40页 |
4 基于特征向量的人物关系抽取方法中的分类器选择 | 第40-50页 |
4.1 K-近邻算法 | 第40-42页 |
4.2 决策树分类法 | 第42-43页 |
4.3 朴素贝叶斯分类法 | 第43-44页 |
4.4 神经网络 | 第44-45页 |
4.5 支持向量机 | 第45-50页 |
4.5.1 SVM支持向量机简介 | 第45-46页 |
4.5.2 SVM实现多分类划分的一般方法 | 第46-50页 |
5 基于层次分类的人物关系识别方法 | 第50-65页 |
5.1 人物实体关系的划分 | 第50-53页 |
5.1.1 本人关系 | 第51-52页 |
5.1.2 家庭关系大类 | 第52-53页 |
5.1.3 社会关系大类 | 第53页 |
5.2 分类器特征选取 | 第53-54页 |
5.3 层次分类器设计 | 第54页 |
5.4 人物关系抽取流程 | 第54-60页 |
5.4.1 预处理阶段 | 第55-56页 |
5.4.2 构建关系语料库 | 第56页 |
5.4.3 构建关系词典 | 第56-58页 |
5.4.4 构建关系大类模板库 | 第58页 |
5.4.5 构建层次分类模型 | 第58-60页 |
5.5 实验设计与结果分析 | 第60-65页 |
5.5.1 实验数据及评价方法 | 第60-61页 |
5.5.2 实验设计与结果 | 第61-63页 |
5.5.3 实验分析 | 第63-65页 |
6 总结与展望 | 第65-66页 |
参考文献 | 第66-69页 |
作者简历及攻读硕士学位期间取得的研究成果 | 第69-71页 |
学位论文数据集 | 第71页 |