摘要 | 第4-5页 |
ABSTRACT | 第5-6页 |
目录 | 第7-10页 |
第一章 绪论 | 第10-15页 |
1.1 研究背景和意义 | 第10-11页 |
1.2 国内外研究现状 | 第11-12页 |
1.3 本文主要研究工作 | 第12-13页 |
1.4 论文内容组织安排 | 第13-15页 |
第二章 实体信息扩展与信息检索的问题分析 | 第15-26页 |
2.1 引言 | 第15页 |
2.2 信息检索系统框架及主要组成部分 | 第15-19页 |
2.2.1 网络爬虫相关技术 | 第16-17页 |
2.2.2 文本数据的索引建立 | 第17页 |
2.2.3 文档排序的计算方法 | 第17-18页 |
2.2.4 信息检索系统的评价方法 | 第18-19页 |
2.3 自然语言处理的信息扩展应用 | 第19-23页 |
2.3.1 基于文档中词语的文本预处理 | 第20-21页 |
2.3.2 句法成分分析 | 第21-22页 |
2.3.3 共指消解与语义消歧 | 第22-23页 |
2.4 对象检索与传统信息检索系统查询需求分析及对比 | 第23-26页 |
2.4.1 传统信息检索现存问题分析 | 第24页 |
2.4.2 对象检索与传统信息检索对比研究结果 | 第24-26页 |
第三章 基于信息扩展的实体抽取研究和对比 | 第26-30页 |
3.1 引言 | 第26页 |
3.2 基于局部分析的信息查询扩展 | 第26-27页 |
3.3 基于全局分析的扩展词提取 | 第27-28页 |
3.3.1 基于全局聚类的查询扩展技术 | 第27-28页 |
3.3.2 基于隐性语义索引的查询扩展技术 | 第28页 |
3.4 基于语义的实体信息查询扩展 | 第28-29页 |
3.4.1 基于实体同义词的查询扩展技术 | 第28-29页 |
3.4.2 基于概念的实体信息查询扩展技术 | 第29页 |
3.5 实体信息查询扩展与传统查询扩展的对比结果 | 第29-30页 |
第四章 基于共现相关度的实体信息扩展研究 | 第30-46页 |
4.1 基于实体对象的信息抽取应用 | 第30-31页 |
4.2 基于共现信息的扩展算法的框架流程 | 第31-32页 |
4.3 基于实体信息扩展的文本预处理 | 第32页 |
4.4 针对未知数据集的灵活聚类 | 第32-37页 |
4.4.1 特征向量的选择与生产 | 第33-34页 |
4.4.2 改进的凝聚的层次聚类算法 | 第34-35页 |
4.4.3 簇间距离度量 | 第35-37页 |
4.5 一对一关联的词语共现信息提取 | 第37-40页 |
4.6 实验相关资料及结果与分析 | 第40-46页 |
4.6.1 实验数据集的获得与处理 | 第40-42页 |
4.6.2 实验结果与分析 | 第42-46页 |
第五章 基于共指消解的实体语义信息扩展研究 | 第46-58页 |
5.1 实体别名、同义词、身份描述等的信息挖掘的意义与难点分析 | 第46-47页 |
5.2 基于共指消解的语义实体信息扩展 | 第47-52页 |
5.2.1 实体信息扩展的指代消解方法介绍 | 第47-49页 |
5.2.2 针对实体信息扩展的共指消解模型对文本的处理策略 | 第49-52页 |
5.3 基于实体共指信息抽取的规则与特征选择 | 第52-54页 |
5.3.1 完整词匹配模块 | 第52页 |
5.3.2 结构精确匹配模块 | 第52-53页 |
5.3.3 实体表述中末尾中心词的严格匹配模块 | 第53-54页 |
5.4 实验过程与结果 | 第54-58页 |
第六章 总结与展望 | 第58-60页 |
6.1 总结 | 第58-59页 |
6.2 下一步工作展望 | 第59-60页 |
参考文献 | 第60-63页 |
致谢 | 第63-64页 |
作者攻读学位期间发表的学术论文目录 | 第64页 |