首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Lucene和Heririx构建搜索引擎的研究和示例实现

摘要第1-5页
ABSTRACT第5-8页
第一章绪论第8-12页
   ·搜索引擎简介第8页
   ·搜索引擎工作原理简介第8-9页
   ·搜索引擎产生的背景和发展历史第9-10页
   ·搜索引擎的分类第10-11页
   ·论文主要工作第11页
   ·论文章节安排第11-12页
第二章 Lucene核心原理祥析第12-34页
   ·Lucene 简介第12页
   ·索引(Indexing)分析第12-23页
     ·索引过程分析第12-14页
       ·转换成文本第13页
       ·将分析过后的数据写入索引第13-14页
     ·控制索引过程第14-23页
   ·搜索(Searching)分析第23-33页
     ·搜索核心API IndexSearcher第23-24页
     ·搜索结果集Hits第24-27页
     ·Lucene评分机制第27-28页
     ·Lucene 内建的Query 对象分析第28-33页
   ·本章小结第33-34页
第三章网络爬虫Heritrix 祥析第34-50页
   ·网络爬虫简介第34-35页
   ·Heritrix 架构分析第35-49页
     ·CrawlOrder 抓取任务控制第36页
     ·CrawController 中央控制器第36-38页
     ·Frontier 链接制造工厂第38-40页
     ·Heritrix 的多线程ToeThread 和ToePool第40-45页
     ·处理链和Processor第45-49页
   ·本章小结第49-50页
第四章 搜索引擎示例的设计实现第50-76页
   ·搜索引擎示例的总体结构介绍第50-51页
   ·网页抓取器的设计实现第51-62页
     ·定制 Extractor第51-57页
     ·扩展FrontierScheduler 过滤下载内容第57-59页
     ·取消robots.txt 的限制第59-60页
     ·Heritrix 对网页的抓取实现第60-62页
   ·索引模块的设计实现第62-68页
     ·文件内容分析器设计实现第62-66页
     ·索引器的设计与实现第66-68页
   ·搜索模块的设计实现第68-73页
     ·搜索器的设计实现第68-69页
     ·用户界面search.jsp 的设计实现第69-73页
   ·搜索引擎示例的运行演示第73-75页
   ·本章小结第75-76页
第五章 搜索引擎示例的搜索优化第76-89页
   ·Lucene 搜索结果排序调整第76-79页
     ·使用Lucene 的Sort 类对搜索结果排序第76-79页
   ·使用Filter(过滤器)缩小示例搜索引擎的搜索结果集第79-83页
     ·使用QueryFilter 在搜索结果中再次搜索第79-83页
   ·Lucene 排序算法的改进实现第83-88页
   ·本章小结第88-89页
第六章 结束语第89-90页
附录:Lucene 分析器和中文分词第90-107页
致谢第107-108页
个人简历,攻硕期间发表的学术论文第108-109页
参考文献第109-112页

论文共112页,点击 下载论文
上一篇:轻量级框架在网上购物系统中的应用研究
下一篇:可信计算中基于JVM构建完整信任链的研究与设计