第1章 绪论 | 第1-14页 |
·什么是搜索引擎 | 第8页 |
·搜索引擎产生的背景和发展历史 | 第8-10页 |
·搜索引擎的分类 | 第10-11页 |
·主要搜索引擎简介 | 第11-13页 |
·本文的主要工作 | 第13页 |
·论文的结构 | 第13-14页 |
第2章 搜索引擎的基本原理及数据结构剖析 | 第14-32页 |
·搜索引擎的基本组成及其功能 | 第14-17页 |
·搜索引擎的详细工作流程 | 第17-19页 |
·搜索引擎的软件数据结构 | 第19-32页 |
·页面存储库(Repository) | 第20-21页 |
·文档索引库(Document Index) | 第21-22页 |
·词典库(Lexicon) | 第22-23页 |
·Hit 列表 | 第23-28页 |
·前向索引表(Forward Index) | 第28-30页 |
·后向索引表(Inverted Index) | 第30-32页 |
第3章 搜索引擎的精度研究和页面优先算法 | 第32-45页 |
·搜索引擎的性能指标 | 第32页 |
·页面优先度算法基础 | 第32-35页 |
·网页出度和入度 | 第32-33页 |
·互联网网站链接组织结构 | 第33-35页 |
·网页信息相关的页面优先度算法 | 第35-39页 |
·以网页内容为基础的算法 | 第35-36页 |
·以网页链接为基础的PageRank 算法 | 第36-39页 |
·用户行为相关的页面优先度算法 | 第39-41页 |
·以用户点击率为基础的DirectHit 算法 | 第39-41页 |
·其他与用户行为相关的方法 | 第41页 |
·页面自动聚类技术 | 第41-45页 |
·页面相关度介绍 | 第42-43页 |
·页面自动聚类方法 | 第43-45页 |
第4章 Lucene 软件包介绍 | 第45-52页 |
·Lucene 软件包简介 | 第45-46页 |
·Lucene 全文检索的实现机制 | 第46-48页 |
·Lucene 的创新之处 | 第48-52页 |
第5章 四川省通信管理局WEB 站内信息搜索系统 | 第52-65页 |
·开发平台搭建 | 第52-53页 |
·开发软件安装和配置 | 第53-55页 |
·四川省通信管理局WEB 站内信息搜索系统软件结构及流程 | 第55-60页 |
·搜索系统的索引过程 | 第56-58页 |
·搜索系统的检索过程 | 第58-59页 |
·四川省通信管理局站内信息搜索引擎系统主程序 | 第59-60页 |
·四川省通信管理局WEB 站内信息搜索系统页面设计 | 第60-61页 |
·四川省通信管理局WEB 站内信息搜索系统运行 | 第61-65页 |
第6章 四川省通信管理局WEB 站内信息搜索系统的改进页面优先算法 | 第65-79页 |
·原有基础排序算法 | 第65-66页 |
·改进后的页面优先算法 | 第66-67页 |
·改进页面优先算法的软件实现 | 第67-75页 |
·重要主页加分部分的软件实现 | 第68-69页 |
·用户二次检索部分的软件实现 | 第69-71页 |
·PageRank 算法部分的软件实现 | 第71-74页 |
·权重系数平衡 | 第74-75页 |
·改进页面优先算法对搜索系统性能的提高 | 第75-78页 |
·下一步工作 | 第78-79页 |
第7章 结束语 | 第79-81页 |
参考文献 | 第81-82页 |