| 第1章 绪论 | 第1-14页 |
| ·什么是搜索引擎 | 第8页 |
| ·搜索引擎产生的背景和发展历史 | 第8-10页 |
| ·搜索引擎的分类 | 第10-11页 |
| ·主要搜索引擎简介 | 第11-13页 |
| ·本文的主要工作 | 第13页 |
| ·论文的结构 | 第13-14页 |
| 第2章 搜索引擎的基本原理及数据结构剖析 | 第14-32页 |
| ·搜索引擎的基本组成及其功能 | 第14-17页 |
| ·搜索引擎的详细工作流程 | 第17-19页 |
| ·搜索引擎的软件数据结构 | 第19-32页 |
| ·页面存储库(Repository) | 第20-21页 |
| ·文档索引库(Document Index) | 第21-22页 |
| ·词典库(Lexicon) | 第22-23页 |
| ·Hit 列表 | 第23-28页 |
| ·前向索引表(Forward Index) | 第28-30页 |
| ·后向索引表(Inverted Index) | 第30-32页 |
| 第3章 搜索引擎的精度研究和页面优先算法 | 第32-45页 |
| ·搜索引擎的性能指标 | 第32页 |
| ·页面优先度算法基础 | 第32-35页 |
| ·网页出度和入度 | 第32-33页 |
| ·互联网网站链接组织结构 | 第33-35页 |
| ·网页信息相关的页面优先度算法 | 第35-39页 |
| ·以网页内容为基础的算法 | 第35-36页 |
| ·以网页链接为基础的PageRank 算法 | 第36-39页 |
| ·用户行为相关的页面优先度算法 | 第39-41页 |
| ·以用户点击率为基础的DirectHit 算法 | 第39-41页 |
| ·其他与用户行为相关的方法 | 第41页 |
| ·页面自动聚类技术 | 第41-45页 |
| ·页面相关度介绍 | 第42-43页 |
| ·页面自动聚类方法 | 第43-45页 |
| 第4章 Lucene 软件包介绍 | 第45-52页 |
| ·Lucene 软件包简介 | 第45-46页 |
| ·Lucene 全文检索的实现机制 | 第46-48页 |
| ·Lucene 的创新之处 | 第48-52页 |
| 第5章 四川省通信管理局WEB 站内信息搜索系统 | 第52-65页 |
| ·开发平台搭建 | 第52-53页 |
| ·开发软件安装和配置 | 第53-55页 |
| ·四川省通信管理局WEB 站内信息搜索系统软件结构及流程 | 第55-60页 |
| ·搜索系统的索引过程 | 第56-58页 |
| ·搜索系统的检索过程 | 第58-59页 |
| ·四川省通信管理局站内信息搜索引擎系统主程序 | 第59-60页 |
| ·四川省通信管理局WEB 站内信息搜索系统页面设计 | 第60-61页 |
| ·四川省通信管理局WEB 站内信息搜索系统运行 | 第61-65页 |
| 第6章 四川省通信管理局WEB 站内信息搜索系统的改进页面优先算法 | 第65-79页 |
| ·原有基础排序算法 | 第65-66页 |
| ·改进后的页面优先算法 | 第66-67页 |
| ·改进页面优先算法的软件实现 | 第67-75页 |
| ·重要主页加分部分的软件实现 | 第68-69页 |
| ·用户二次检索部分的软件实现 | 第69-71页 |
| ·PageRank 算法部分的软件实现 | 第71-74页 |
| ·权重系数平衡 | 第74-75页 |
| ·改进页面优先算法对搜索系统性能的提高 | 第75-78页 |
| ·下一步工作 | 第78-79页 |
| 第7章 结束语 | 第79-81页 |
| 参考文献 | 第81-82页 |