摘要 | 第4-6页 |
ABSTRACT | 第6-7页 |
第一章 绪论 | 第10-18页 |
1.1 论文研究背景与意义 | 第10-12页 |
1.1.1 论文研究背景 | 第10-11页 |
1.1.2 论文研究意义 | 第11-12页 |
1.2 国内外研究现状 | 第12-14页 |
1.3 主要研究内容 | 第14-16页 |
1.3.1 基于弱监督关系抽取的研究 | 第14页 |
1.3.2 减少错误标记、噪声干扰的处理 | 第14-15页 |
1.3.3 触发词类别对分类性能的影响 | 第15页 |
1.3.4 弱监督学习的假设宽松处理 | 第15-16页 |
1.4 论文组织结构 | 第16-18页 |
第二章 关系抽取技术研究综述 | 第18-30页 |
2.1 实体关系抽取基础 | 第18-21页 |
2.1.1 实体 | 第18-20页 |
2.1.2 实体关系 | 第20-21页 |
2.1.3 关系实例(词序列) | 第21页 |
2.2 实体关系抽取常见算法 | 第21-26页 |
2.2.1 基于规则的匹配方案 | 第22页 |
2.2.2 基于机器学习思想的一般流程 | 第22-23页 |
2.2.3 基于监督学习的关系抽取方案 | 第23-24页 |
2.2.4 基于半监督学习的关系抽取方案 | 第24-25页 |
2.2.5 基于无督学习的关系抽取方案 | 第25-26页 |
2.2.6 基于弱监督学习的关系抽取方案 | 第26页 |
2.2.7 几种方案的优缺点比较 | 第26页 |
2.3 实体关系抽取常见语料集以及常用工具 | 第26-28页 |
2.3.1 常见语料集 | 第26-27页 |
2.3.2 常用工具 | 第27-28页 |
2.4 实体关系抽取系统性能评估标准 | 第28-29页 |
2.5 本章小结 | 第29-30页 |
第三章 基于弱监督学习的关系抽取 | 第30-47页 |
3.1 基本原理 | 第30-33页 |
3.1.1 知识库Freebase | 第30-31页 |
3.1.2 实体关系抽取的相关假设 | 第31-33页 |
3.2 特征提取 | 第33-37页 |
3.2.1 词汇特征 | 第33-36页 |
3.2.2 语义特征 | 第36页 |
3.2.3 语法特征 | 第36-37页 |
3.3 词序列之间相似性 | 第37-38页 |
3.4 触发词关系划分 | 第38-41页 |
3.5 实验结果及分析 | 第41-46页 |
3.5.1 实验数据选择 | 第41页 |
3.5.2 Freebase预处理 | 第41-42页 |
3.5.3 特征组合 | 第42-43页 |
3.5.4 抽取系统性能评估及分析 | 第43-46页 |
3.6 本章小结 | 第46-47页 |
第四章 结合过滤机制的子序列映射生成模型 | 第47-62页 |
4.1 弱监督学习存在的弊端 | 第47-48页 |
4.2 现有的解决方案 | 第48-51页 |
4.2.1 At-least-one约束 | 第48-49页 |
4.2.2 分级主题模型(Hierarchical Topic model) | 第49-50页 |
4.2.3 关联语法(Pattern Correlations) | 第50-51页 |
4.3 结合过滤机制的子序列映射分层主题模型 | 第51-59页 |
4.3.1 基于序列字典的生成模型 | 第51-55页 |
4.3.2 预测实体对是否被标记 | 第55-57页 |
4.3.3 利用错误标注集合对标记结果进行过滤 | 第57-59页 |
4.4 实验结果及分析 | 第59-61页 |
4.5 本章小结 | 第61-62页 |
第五章 总结和展望 | 第62-64页 |
5.1 论文的工作总结 | 第62-63页 |
5.2 研究展望 | 第63-64页 |
参考文献 | 第64-70页 |
致谢 | 第70页 |