摘要 | 第4-5页 |
Abstract | 第5页 |
第1章 绪论 | 第10-24页 |
1.1 研究背景及意义 | 第10-12页 |
1.2 相关研究及存在问题 | 第12-22页 |
1.2.1 基于知识工程的关系抽取 | 第13-14页 |
1.2.2 基于机器学习的关系抽取 | 第14-18页 |
1.2.3 远程监督关系抽取 | 第18-19页 |
1.2.4 远程监督关系抽取相关降噪方法 | 第19-21页 |
1.2.5 从句识别 | 第21-22页 |
1.3 研究目标及内容 | 第22页 |
1.4 本文结构组织 | 第22-24页 |
第2章 相关方法和技术 | 第24-31页 |
2.1 基于HMM的从句识别 | 第24-28页 |
2.2 标准协同训练(Co-Training) | 第28-29页 |
2.3 Tri-Training | 第29-30页 |
2.4 章小结 | 第30-31页 |
第3章 结合从句识别与半监督集成学习的远程监督关系抽取 | 第31-42页 |
3.1 概述 | 第31页 |
3.2 方法框架 | 第31-32页 |
3.3 候选关系实例生成 | 第32-33页 |
3.4 基于从句识别的去噪算法 | 第33-35页 |
3.5 特征抽取 | 第35-36页 |
3.6 改进的半监督集成学习算法 | 第36-41页 |
3.6.1 置信度度量 | 第38-39页 |
3.6.2 过滤筛选 | 第39-41页 |
3.7 本章小结 | 第41-42页 |
第4章 实验评估 | 第42-54页 |
4.1 数据集 | 第42-43页 |
4.2 实验设置 | 第43-45页 |
4.2.1 基线方法 | 第43-44页 |
4.2.2 ETT评估 | 第44-45页 |
4.2.3 特征类型及表示方式评估 | 第45页 |
4.2.4 NRCI有效性评估 | 第45页 |
4.2.5 对比方法设置 | 第45页 |
4.3 实验结果与分析 | 第45-53页 |
4.3.1 基分类器类别及数量对ETT的影响 | 第46-48页 |
4.3.2 ETT VS Tri-Training | 第48-49页 |
4.3.3 特征类型及表示方式评估 | 第49-50页 |
4.3.4 NRCI的有效性评估 | 第50-52页 |
4.3.5 与其他方法的对比 | 第52-53页 |
4.4 本章小结 | 第53-54页 |
第5章 总结与展望 | 第54-56页 |
5.1 总结 | 第54-55页 |
5.2 展望 | 第55-56页 |
参考文献 | 第56-61页 |
致谢 | 第61页 |