摘要 | 第1-5页 |
Abstract | 第5-7页 |
目录 | 第7-10页 |
第一章 绪论 | 第10-13页 |
·主题搜索引擎优势与研究现状 | 第10-11页 |
·选题背景和研究意义 | 第11页 |
·本文的工作与安排 | 第11-13页 |
第二章 基础理论及相关技术 | 第13-27页 |
·通用搜索引擎介绍 | 第13-14页 |
·主题搜索引擎的工作原理 | 第14-15页 |
·主题搜索引擎涉及的相关技术 | 第15-22页 |
·向量空间 | 第15-17页 |
·特征权重 | 第17-18页 |
·索引构建 | 第18-20页 |
·数据检索 | 第20-22页 |
·Nutch 平台简介 | 第22-26页 |
·Nutch 的工作流程 | 第22-23页 |
·Lucene 简介 | 第23-24页 |
·Hadoop 的 MapReduce 简介 | 第24-26页 |
·特殊主题的含义 | 第26页 |
·本章小结 | 第26-27页 |
第三章 面向特殊主题的排序算法研究 | 第27-43页 |
·常用排序算法 | 第27-28页 |
·PageRank 算法 | 第28-31页 |
·PageRank 算法的基本原理 | 第28-30页 |
·PageRank 算法的相关研究 | 第30-31页 |
·面向特殊主题的 PageRank 算法(SPF-PR) | 第31-34页 |
·SPF-PR 算法设计思想 | 第32-33页 |
·SPF-PR 算法设计实现 | 第33-34页 |
·Nutch 排序改进及 SPF-PR 算法集成 | 第34-42页 |
·Nutch 的排序机制 | 第34-35页 |
·Nutch 排序的 OPIC 算法 | 第35-37页 |
·Nutch 排序的改进方法 | 第37-39页 |
·SPF-PR 算法集成 | 第39-42页 |
·本章小结 | 第42-43页 |
第四章 基于种子拓展(SEB-VSM)的特殊主题检索研究 | 第43-58页 |
·VSM 检索模型 | 第43-44页 |
·VSM 在特殊主题检索中存在的不足 | 第44-46页 |
·查询扩展的相关技术 | 第46-48页 |
·基于种子拓展(SEB-VSM)的查询扩展设计 | 第48-53页 |
·SEB-VSM 检索算法的思想 | 第48-49页 |
·SEB-VSM 检索模型的设计 | 第49-50页 |
·SEB-VSM 检索模型的实现 | 第50-52页 |
·基于离线计算的 SEB-VSM 检索模型优化 | 第52-53页 |
·SEB-VSM 检索算法实验 | 第53-57页 |
·实验设计 | 第53-55页 |
·实验结果分析 | 第55-57页 |
·本章小结 | 第57-58页 |
第五章 基于聚类分析的 SEB-VSM 检索模型优化 | 第58-69页 |
·常见聚类算法 | 第58-59页 |
·Lingo 聚类算法研究 | 第59-61页 |
·基于 Lingo 聚类的特征降维设计 | 第61-63页 |
·特征降维的概念与常用算法 | 第61页 |
·基于聚类的 Chi-square 统计量降维 | 第61-63页 |
·基于 Lingo 聚类的相似度优化 | 第63-65页 |
·基于聚类的相似度优化设计 | 第63-65页 |
·基于聚类的相似度优化实现 | 第65页 |
·特征降维和相似度优化实验 | 第65-68页 |
·实验设计 | 第65-66页 |
·实验结果分析 | 第66-68页 |
·本章小结 | 第68-69页 |
第六章 系统设计与运行评测 | 第69-76页 |
·系统架构设计 | 第69-71页 |
·系统逻辑结构 | 第69-70页 |
·系统体系结构 | 第70-71页 |
·与 Nutch 系统对比 | 第71页 |
·运行环境与配置 | 第71-72页 |
·系统运行环境 | 第71-72页 |
·数据准备 | 第72页 |
·综合测试与效果分析 | 第72-75页 |
·系统运行与测试 | 第72-73页 |
·性能与效果分析 | 第73-75页 |
·本章小结 | 第75-76页 |
第七章 总结与展望 | 第76-77页 |
·本文所做的工作总结 | 第76页 |
·下一步的工作与展望 | 第76-77页 |
参考文献 | 第77-79页 |
个人简历、在学期间发表的学术论文与研究成果 | 第79页 |