首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

基于Lucene和Heritrix的小型主题搜索引擎的研究及实现

摘要第1-6页
ABSTRACT第6-11页
符号对照表第11-12页
缩略语对照表第12-15页
第一章 绪论第15-21页
   ·论文研究目的和意义第15-16页
   ·搜索引擎和网络爬虫的发展与概述第16-18页
     ·搜索引擎的概念和发展历史第16-18页
     ·网络爬虫的概念第18页
   ·本文的工作内容第18-19页
   ·本章小结第19-21页
第二章 专项主题搜索引擎的相关技术第21-29页
   ·常见索引形式的介绍第21-22页
   ·正则表达式的介绍第22-23页
   ·网络爬虫的常用技术分析第23-27页
   ·本章小结第27-29页
第三章 搜索引擎信息准备过程的研究与实现第29-47页
   ·开源网络爬虫Heritrix的结构分析与研究第29-37页
   ·Heritrix爬虫功能扩展与定制的实现第37-44页
     ·Heritrix爬虫需要改进的地方第37-39页
     ·Heritrix爬虫功能扩展与定制的实现第39-44页
   ·从网页中提取索引内容的实现第44-46页
   ·本章小结第46-47页
第四章 Lucene全文搜索工具的分析研究与扩展定制第47-65页
   ·对Lucene的原理分析与研究第47-57页
     ·Lucene建立索引的过程分析第47-52页
     ·Lucene对建立好的索引进行搜索的方法第52-54页
     ·Lucene对搜索结果的处理方法第54-57页
   ·针对主题搜索引擎而对Lucene进行的定制第57-63页
     ·对返回搜索结果的排序和过滤规则的定制第57-59页
     ·在关键词划分时进行筛选和过滤方法的定制第59-61页
     ·对查询语句的一些中文优化第61-63页
   ·本章小结第63-65页
第五章 主题搜索引擎的实现与测试第65-75页
   ·信息搜集的实现过程第65-68页
   ·信息搜索查询的实现第68-70页
   ·针对散文主题的搜索过滤方法第70-71页
   ·主题搜索引擎的功能测试第71-74页
   ·本章小结第74-75页
第六章 结束语第75-77页
   ·完成的工作第75页
   ·需要改进和继续研究的地方第75-77页
参考文献第77-79页
致谢第79-81页
作者简介第81页

论文共81页,点击 下载论文
上一篇:基于B/S架构的办公自动化系统的设计与实现
下一篇:基于B/S架构的共建园区税款电子划转系统的设计与实现