中文摘要 | 第1-6页 |
英文摘要 | 第6-8页 |
1 引言 | 第8-14页 |
1.1 论文的研究背景和选题依据 | 第8-9页 |
1.2 论文的研究意义 | 第9页 |
1.3 论文选题的独创性及主要研究内容 | 第9-13页 |
1.3.1 选题的独创性 | 第9-12页 |
1.3.2 主要研究内容 | 第12-13页 |
1.4 论文的内容组织 | 第13-14页 |
2 WEB信息检索与查询扩展 | 第14-25页 |
2.1 WEB信息检索 | 第14-20页 |
2.1.1 WEB信息的特点 | 第14-15页 |
2.1.2 WEB信息检索 | 第15-20页 |
2.2 查询扩展方法 | 第20-25页 |
2.2.1 查询扩展简介 | 第20-21页 |
2.2.2 国内外研究现状 | 第21-25页 |
3 概念检索 | 第25-42页 |
3.1 概念检索简介 | 第25-27页 |
3.2 ONTOLOGY | 第27-31页 |
3.2.1 Ontology简介 | 第27-29页 |
3.2.2 Ontology映射 | 第29-31页 |
3.3 知识库构建过程 | 第31-42页 |
3.3.1 Yahoo分类目录网页下载 | 第31-34页 |
3.3.2 网页预处理 | 第34-35页 |
3.3.3 概念抽取 | 第35-38页 |
3.3.4 知识库构建 | 第38-42页 |
4 用户兴趣建模 | 第42-60页 |
4.1 用户兴趣建模与信息检索的关系 | 第42-43页 |
4.2 用户兴趣建模方法 | 第43-45页 |
4.2.1 用户兴趣模型的分类与主要方式 | 第43-45页 |
4.2.2 用户兴趣模型的关键组成部分 | 第45页 |
4.3 用户兴趣建模步骤 | 第45-52页 |
4.3.1 机器学习和数据挖掘 | 第45-46页 |
4.3.2 文本的自动分类 | 第46-48页 |
4.3.3 Yahoo分类目录网页下载和网页数据预处理 | 第48页 |
4.3.4 SVM分类器 | 第48-52页 |
4.4 文本分割技术 | 第52-60页 |
4.4.1 自动生成DOM树 | 第53页 |
4.4.2 确定主题边界 | 第53-54页 |
4.4.3 转化为平面文本分割 | 第54-57页 |
4.4.4 DOM树平滑文本分割结果 | 第57-60页 |
5 查询扩展机制及实验结果 | 第60-74页 |
5.1 查询扩展机制 | 第60-64页 |
5.1.1 目前查询扩展机制存在的缺陷 | 第60-61页 |
5.1.2 概念检索的优缺点 | 第61-62页 |
5.1.3 个性化的概念查询扩展机制 | 第62-64页 |
5.2 系统实现 | 第64-65页 |
5.2.1 知识库构建模块 | 第64-65页 |
5.2.2 用户兴趣建模 | 第65页 |
5.2.3 查询扩展方法 | 第65页 |
5.3 实验及结果 | 第65-74页 |
5.3.1 显著性验证 | 第65-66页 |
5.3.2 查询集和测试集 | 第66-68页 |
5.3.3 基于向量空间模型的平台实验 | 第68-74页 |
6 结束语 | 第74-76页 |
参考文献 | 第76-83页 |
攻读硕士学位期间发表的学术论文目录 | 第83-84页 |
致谢 | 第84页 |