首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Lucene的搜索引擎技术的研究与改进

摘要第1页
Abstract第3-7页
第1章 绪论第7-12页
   ·研究背景第7页
   ·什么是搜索引擎第7页
   ·搜索引擎的现状和发展趋势第7-9页
   ·搜索引擎的分类第9-10页
   ·本论文的主要工作第10页
   ·论文章节安排第10-12页
第2章 Web搜索引擎和Lucene工具包技术分析第12-19页
   ·搜索引擎的基本原理和构成第12-14页
   ·评价搜索引擎的技术指标第14-15页
   ·Lucene全文索引工具包第15-19页
     ·Lucene全文索引工具包介绍第15-16页
     ·Lucene的全文索引存储文件结构第16-17页
     ·Lucene的创新之处第17页
     ·不足之处第17-19页
第3章 网络机器人(Robot)的设计及检索结果排序的分析研究第19-33页
   ·多线程的网络爬行机器人(Robot)的设计第19-28页
     ·Java多线程第19-21页
       ·线程生命周期第20-21页
       ·Java创建多线程的2种途径第21页
     ·Robot的需求分析第21-22页
     ·Robot的工作过程第22页
     ·Robot关键技术第22-24页
     ·Robot系统结构和模块划分第24-25页
     ·信息采集用例图设计第25-26页
     ·Robot活动图设计第26-27页
     ·Robot控制器处理过程协作图设计第27-28页
   ·对Lucene检索结果排序分析研究第28-33页
     ·Lucene原检索结果排序算法介绍第28-29页
     ·对Lucene检索结果的排序算法的改进第29-33页
       ·网页文档的链接第29-30页
       ·网页的响应时间第30-31页
       ·正文大小第31页
       ·关键词出现在特殊位置第31-32页
       ·用户行为特征第32-33页
第4章 网络机器人(Robot)和检索结果排序算法的实现第33-57页
   ·Robot的实现第33-44页
     ·Robot的具体模块划分第33页
     ·ParseURL类第33-37页
       ·功能和处理过程第33-34页
       ·类图设计第34-35页
       ·关键技术的处理第35-37页
     ·ProcessUrl类第37-38页
       ·功能描述第37页
       ·类图设计第37-38页
     ·RobotManager类第38-41页
       ·功能和处理过程第38-39页
       ·类图设计第39-41页
     ·RobotMonitor类第41-42页
       ·类图设计第41-42页
     ·Robot类第42-43页
     ·Robot各类之间的关系第43-44页
     ·将Robot集成到Lucene第44页
   ·改进的检索结果排序算法的实现第44-49页
     ·改进的检索结果排序算法计算公式第44-45页
     ·改进的检索结果排序算法的代码实现第45-48页
     ·权值选择第48-49页
   ·Web搜索引擎系统的实现第49-57页
     ·模块划分第49页
     ·信息采集模块的实现第49-50页
     ·信息索引模块的实现第50-52页
     ·信息检索模块的实现第52-57页
第5章 系统重点、难点及性能评价第57-67页
   ·重点、难点第57-61页
     ·Robot对网页各种内容的提取第57页
     ·Robot线程管理第57-59页
     ·大规模搜索内存不足的问题第59-60页
     ·影响网页检索结果排序算法的因素和各因素权值的设定(权值的选取)第60-61页
   ·系统性能评价第61-67页
     ·多线程Robot的爬行性能测试第61-63页
     ·Lucene优化前后的网页检索结果排序对比分析第63-67页
第6章 结束语第67-68页
参考文献第68-71页
致谢第71页

论文共71页,点击 下载论文
上一篇:大鼠主动持续性注意力检测实验装置的研制
下一篇:长沙市茁葭文化培训中心发展战略研究