摘要 | 第4-5页 |
ABSTRACT | 第5页 |
第一章 引言 | 第9-12页 |
1.1 课题研究背景 | 第9-11页 |
1.1.1 选题背景 | 第9页 |
1.1.2 研究意义 | 第9-11页 |
1.2 主要的研究工作 | 第11页 |
1.3 论文结构 | 第11-12页 |
第二章 信息抽取技术综述 | 第12-24页 |
2.1 信息抽取技术的发展 | 第12-13页 |
2.2 信息抽取概述 | 第13-15页 |
2.2.1 信息抽取的任务 | 第13页 |
2.2.2 信息抽取与信息检索的关系 | 第13-15页 |
2.3 关系抽取的主要方法 | 第15-21页 |
2.3.1 预定义关系类型 | 第15-19页 |
2.3.2 开放域关系聚类 | 第19-21页 |
2.4 系统的评价指标 | 第21-23页 |
2.4.1 实体关系抽取系统的评价 | 第21-22页 |
2.4.2 实体关系聚类系统的评价 | 第22-23页 |
2.5 本章小结 | 第23-24页 |
第三章 基于Bootstrapping的实体关系抽取 | 第24-38页 |
3.1 关系模式抽取 | 第24-27页 |
3.1.1 词序模式 | 第24页 |
3.1.2 依存路径模式 | 第24-27页 |
3.2 自举学习方法 | 第27-31页 |
3.2.1 传统Bootstrapping的对偶性原理 | 第27页 |
3.2.2 语义漂移问题 | 第27-28页 |
3.2.3 基于Bootstrapping的改进 | 第28-31页 |
3.3 系统设计 | 第31-35页 |
3.3.1 别名扩展模块 | 第32-33页 |
3.3.2 实体消歧模块 | 第33-34页 |
3.3.3 共指消解模块 | 第34页 |
3.3.4 篇章推理模块 | 第34-35页 |
3.4 实验与分析 | 第35-37页 |
3.4.1 数据准备及实验 | 第35页 |
3.4.2 结果分析 | 第35-37页 |
3.5 本章小结 | 第37-38页 |
第四章 面向论坛的实体关系挖掘 | 第38-49页 |
4.1 新词发现 | 第38-39页 |
4.1.1 重复串检测方法 | 第38-39页 |
4.1.2 信息熵识别方法 | 第39页 |
4.2 词激活力 | 第39-40页 |
4.3 系统设计 | 第40-43页 |
4.3.1 命名实体识别模块 | 第41-42页 |
4.3.2 新词发现模块 | 第42页 |
4.3.4 关系聚类模块 | 第42-43页 |
4.3.5 属性抽取模块 | 第43页 |
4.4 实验与分析 | 第43-48页 |
4.5 本章小结 | 第48-49页 |
第五章 总结与展望 | 第49-50页 |
5.1 论文工作总结 | 第49页 |
5.2 不足与展望 | 第49-50页 |
参考文献 | 第50-54页 |
致谢 | 第54-55页 |
攻读学位期间发表的学术论文目录 | 第55页 |