首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于Lucene的Web站内信息搜索系统

第1章 绪论第1-14页
   ·什么是搜索引擎第8页
   ·搜索引擎产生的背景和发展历史第8-10页
   ·搜索引擎的分类第10-11页
   ·主要搜索引擎简介第11-13页
   ·本文的主要工作第13页
   ·论文的结构第13-14页
第2章 搜索引擎的基本原理及数据结构剖析第14-32页
   ·搜索引擎的基本组成及其功能第14-17页
   ·搜索引擎的详细工作流程第17-19页
   ·搜索引擎的软件数据结构第19-32页
     ·页面存储库(Repository)第20-21页
     ·文档索引库(Document Index)第21-22页
     ·词典库(Lexicon)第22-23页
     ·Hit 列表第23-28页
     ·前向索引表(Forward Index)第28-30页
     ·后向索引表(Inverted Index)第30-32页
第3章 搜索引擎的精度研究和页面优先算法第32-45页
   ·搜索引擎的性能指标第32页
   ·页面优先度算法基础第32-35页
     ·网页出度和入度第32-33页
     ·互联网网站链接组织结构第33-35页
   ·网页信息相关的页面优先度算法第35-39页
     ·以网页内容为基础的算法第35-36页
     ·以网页链接为基础的PageRank 算法第36-39页
   ·用户行为相关的页面优先度算法第39-41页
     ·以用户点击率为基础的DirectHit 算法第39-41页
     ·其他与用户行为相关的方法第41页
   ·页面自动聚类技术第41-45页
     ·页面相关度介绍第42-43页
     ·页面自动聚类方法第43-45页
第4章 Lucene 软件包介绍第45-52页
   ·Lucene 软件包简介第45-46页
   ·Lucene 全文检索的实现机制第46-48页
   ·Lucene 的创新之处第48-52页
第5章 四川省通信管理局WEB 站内信息搜索系统第52-65页
   ·开发平台搭建第52-53页
   ·开发软件安装和配置第53-55页
   ·四川省通信管理局WEB 站内信息搜索系统软件结构及流程第55-60页
     ·搜索系统的索引过程第56-58页
     ·搜索系统的检索过程第58-59页
     ·四川省通信管理局站内信息搜索引擎系统主程序第59-60页
   ·四川省通信管理局WEB 站内信息搜索系统页面设计第60-61页
   ·四川省通信管理局WEB 站内信息搜索系统运行第61-65页
第6章 四川省通信管理局WEB 站内信息搜索系统的改进页面优先算法第65-79页
   ·原有基础排序算法第65-66页
   ·改进后的页面优先算法第66-67页
   ·改进页面优先算法的软件实现第67-75页
     ·重要主页加分部分的软件实现第68-69页
     ·用户二次检索部分的软件实现第69-71页
     ·PageRank 算法部分的软件实现第71-74页
     ·权重系数平衡第74-75页
   ·改进页面优先算法对搜索系统性能的提高第75-78页
   ·下一步工作第78-79页
第7章 结束语第79-81页
参考文献第81-82页

论文共82页,点击 下载论文
上一篇:关于整数编码和Slepian-Wolf编码的研究
下一篇:我国乡镇改革的研究评述与实践探索