摘要 | 第5-6页 |
ABSTRACT | 第6-7页 |
第一章 绪论 | 第11-16页 |
1.1 选题背景 | 第11-12页 |
1.2 国内外研究现状 | 第12-13页 |
1.3 本文主要的工作 | 第13-15页 |
1.3.1 基于改进LDA主题模型的查询推荐的研究 | 第14页 |
1.3.2 基于查询词语义和查询点击文档聚类的查询推荐的研究 | 第14页 |
1.3.3 搜索推荐系统的设计与实现 | 第14-15页 |
1.4 论文结构 | 第15-16页 |
第二章 相关技术研究 | 第16-29页 |
2.1 互联网医学信息 | 第16-17页 |
2.2 开源搜索引擎Nutch | 第17-19页 |
2.2.1 Nutch整体架构 | 第17-18页 |
2.2.2 Nutch工作流程 | 第18-19页 |
2.3 聚类技术 | 第19-20页 |
2.3.1 基于划分的聚类 | 第19页 |
2.3.2 基于层次的聚类 | 第19-20页 |
2.3.3 基于密度的聚类 | 第20页 |
2.3.4 基于网格的聚类 | 第20页 |
2.4 用户的搜索行为和意图 | 第20-24页 |
2.4.1 用户的搜索行为 | 第20-21页 |
2.4.2 用户的搜索意图 | 第21-22页 |
2.4.3 用户的搜索日志与日志挖掘 | 第22-24页 |
2.5 语义相似度 | 第24-28页 |
2.5.1 基于世界知识的相似度计算 | 第25-27页 |
2.5.2 基于统计的相似度计算 | 第27-28页 |
2.6 本章小结 | 第28-29页 |
第三章 基于改进LDA主题模型的查询推荐 | 第29-45页 |
3.1 主题模型介绍 | 第29-31页 |
3.2 三种模型对比 | 第31-35页 |
3.2.1 Unigram模型 | 第32页 |
3.2.2 Mixture of Unigrams模型 | 第32-33页 |
3.2.3 LDA主题模型 | 第33-35页 |
3.3 一种改进的LDA主题模型 | 第35-37页 |
3.4 基于改进LDA主题模型的查询推荐 | 第37-39页 |
3.5 实验分析 | 第39-44页 |
3.5.1 数据集 | 第39-40页 |
3.5.2 评价标准 | 第40-42页 |
3.5.3 实验测试与分析 | 第42-44页 |
3.6 本章小结 | 第44-45页 |
第四章 查询词相似度计算 | 第45-55页 |
4.1 问题描述 | 第45-47页 |
4.2 传统的查询词相似度算法 | 第47-49页 |
4.2.1 基于图的查询词相似度算法 | 第47-48页 |
4.2.2 基于Session的查询词相似度算法 | 第48-49页 |
4.3 改进的查询相似度算法 | 第49-54页 |
4.3.1 基于用户查询词语义的相似度算法 | 第49-50页 |
4.3.2 基于用户点击页面内容的相似度算法 | 第50-53页 |
4.3.2.1 获取每篇文档内容的特征向量 | 第50-52页 |
4.3.2.2 计算两篇文档内容的相似度 | 第52-53页 |
4.3.2.3 计算点击文档的相似度 | 第53页 |
4.3.3 基于查询词语义和查询点击文档的相似度算法 | 第53-54页 |
4.4 本章小结 | 第54-55页 |
第五章 基于查询词语义和查询点击文档聚类的查询推荐 | 第55-64页 |
5.1 查询词聚类算法 | 第55-57页 |
5.1.1 层次凝聚聚类的基本思想 | 第55-56页 |
5.1.2 改进层次聚类的基本思想 | 第56-57页 |
5.2 查询推荐策略及基本思想 | 第57-59页 |
5.2.1 查询推荐策略分类 | 第57-58页 |
5.2.2 基于查询词语义和查询点击文档聚类的查询推荐 | 第58-59页 |
5.2.2.1 基于模型的查询推荐策略 | 第58-59页 |
5.2.2.2 查询推荐算法的基本思想 | 第59页 |
5.3 实验测试与分析 | 第59-63页 |
5.3.1 聚类算法实验 | 第59-60页 |
5.3.2 查询推荐算法实验 | 第60-63页 |
5.3.2.1 数据集 | 第60页 |
5.3.2.2 实验测试与分析 | 第60-63页 |
5.4 本章小结 | 第63-64页 |
第六章 系统的设计与实现 | 第64-75页 |
6.1 系统设计 | 第64页 |
6.2 系统开发工具和平台 | 第64页 |
6.3 系统整体架构 | 第64-67页 |
6.3.1 展现层 | 第66页 |
6.3.2 业务层 | 第66页 |
6.3.3 数据层 | 第66-67页 |
6.4 系统各个模块设计及实现 | 第67-74页 |
6.4.1 展现层设计 | 第67页 |
6.4.2 业务层设计 | 第67-72页 |
6.4.2.1 抓取模块 | 第68页 |
6.4.2.2 预处理模块 | 第68-70页 |
6.4.2.3 伪相关反馈模块 | 第70页 |
6.4.2.4 改进LDA的查询推荐模块 | 第70-71页 |
6.4.2.5 查询词聚类模块 | 第71页 |
6.4.2.6 聚类查询推荐模块 | 第71-72页 |
6.4.3 数据层设计 | 第72-74页 |
6.5 系统效果展示 | 第74页 |
6.6 本章小结 | 第74-75页 |
第七章 全文总结与展望 | 第75-77页 |
7.1 总结 | 第75-76页 |
7.2 展望 | 第76-77页 |
致谢 | 第77-78页 |
参考文献 | 第78-81页 |