摘要 | 第5-7页 |
ABSTRACT | 第7-8页 |
第1章 绪论 | 第12-18页 |
1.1 研究背景 | 第12-13页 |
1.2 国内外研究现状分析 | 第13-14页 |
1.2.1 理论研究 | 第13页 |
1.2.2 原型系统研究 | 第13-14页 |
1.3 研究目的与意义 | 第14-15页 |
1.4 研究内容 | 第15-16页 |
1.5 本文主要工作和结构 | 第16-18页 |
第2章 个性化搜索引擎研究综述 | 第18-35页 |
2.1 通用搜索引擎 | 第18-21页 |
2.1.1 通用搜索引擎架构 | 第18-19页 |
2.1.2 向量空间模型和TFIDF | 第19-20页 |
2.1.3 相似度计算和检索 | 第20页 |
2.1.4 查询结果的衡量标准 | 第20-21页 |
2.2 个性化搜索引擎 | 第21-24页 |
2.2.1 个性化搜索框架 | 第21-23页 |
2.2.2 个性化搜索的流程图 | 第23页 |
2.2.3 个性化搜索的“个性化”体现在何处? | 第23-24页 |
2.3 自然语言处理子系统 | 第24-25页 |
2.3.1 常见分词方法介绍 | 第24页 |
2.3.2 ICTCLAS 分词系统介绍 | 第24-25页 |
2.4 网络蜘蛛子系统 | 第25-27页 |
2.4.1 网络蜘蛛子系统架构 | 第25-26页 |
2.4.2 用Python 实现的小型网络蜘蛛 | 第26-27页 |
2.5 索引子系统 | 第27-30页 |
2.5.1 文本索引前的预处理 | 第27-28页 |
2.5.2 索引子系统文件结构 | 第28-29页 |
2.5.3 索引动态更新策略 | 第29-30页 |
2.6 存储子系统 | 第30-32页 |
2.6.1 电视文本文件的存储 | 第31页 |
2.6.2 索引文件的压缩 | 第31-32页 |
2.6.3 文档号的维护原理 | 第32页 |
2.7 用户查询处理子系统 | 第32-33页 |
2.8 个性化搜索子系统介绍 | 第33页 |
2.9 本章小结 | 第33-35页 |
第3章 用户反馈和用户兴趣模型 | 第35-43页 |
3.1 用户反馈 | 第35-36页 |
3.1.1 用户反馈的定义和分类 | 第35-36页 |
3.1.2 显示反馈 | 第36页 |
3.1.3 隐式反馈 | 第36页 |
3.2 用户兴趣模型子系统设计 | 第36-39页 |
3.2.1 用户兴趣模型结构 | 第37-38页 |
3.2.2 使用用户兴趣模型进行个性化的搜索 | 第38-39页 |
3.3 用户兴趣模型学习算法 | 第39-42页 |
3.3.1 更新用户兴趣模型 | 第39-40页 |
3.3.2 更新兴趣模型 | 第40-41页 |
3.3.3 学习新的兴趣类型 | 第41-42页 |
3.4 本章小结 | 第42-43页 |
第4章 用户查询扩展 | 第43-49页 |
4.1 用户查询扩展子系统必要性及实现途径 | 第43页 |
4.2 基于CORPUS 的用户查询扩展 | 第43-46页 |
4.2.1 基于Corpus 的查询扩展子系统结构 | 第43-44页 |
4.2.2 Corpus 库结构 | 第44-45页 |
4.2.3 Corpus 库中词语相似度量化算法 | 第45-46页 |
4.3 基于CORPUS 的查询扩展实现 | 第46-47页 |
4.3.1 词汇空间的构建 | 第46页 |
4.3.2 关系空间的构建 | 第46-47页 |
4.4 采用查询关键字的相似性和IDF 进行扩展 | 第47-48页 |
4.5 本章小结 | 第48-49页 |
第5章 实验与数据分析 | 第49-51页 |
第6章 总结和展望 | 第51-53页 |
6.1 主要结论 | 第51-52页 |
6.2 研究展望 | 第52-53页 |
参考文献 | 第53-54页 |
致谢 | 第54-55页 |
攻读硕士期间发表的学术论文及参与的项目 | 第55页 |