摘要 | 第1-6页 |
ABSTRACT | 第6-11页 |
符号对照表 | 第11-12页 |
缩略语对照表 | 第12-15页 |
第一章 绪论 | 第15-21页 |
·论文研究目的和意义 | 第15-16页 |
·搜索引擎和网络爬虫的发展与概述 | 第16-18页 |
·搜索引擎的概念和发展历史 | 第16-18页 |
·网络爬虫的概念 | 第18页 |
·本文的工作内容 | 第18-19页 |
·本章小结 | 第19-21页 |
第二章 专项主题搜索引擎的相关技术 | 第21-29页 |
·常见索引形式的介绍 | 第21-22页 |
·正则表达式的介绍 | 第22-23页 |
·网络爬虫的常用技术分析 | 第23-27页 |
·本章小结 | 第27-29页 |
第三章 搜索引擎信息准备过程的研究与实现 | 第29-47页 |
·开源网络爬虫Heritrix的结构分析与研究 | 第29-37页 |
·Heritrix爬虫功能扩展与定制的实现 | 第37-44页 |
·Heritrix爬虫需要改进的地方 | 第37-39页 |
·Heritrix爬虫功能扩展与定制的实现 | 第39-44页 |
·从网页中提取索引内容的实现 | 第44-46页 |
·本章小结 | 第46-47页 |
第四章 Lucene全文搜索工具的分析研究与扩展定制 | 第47-65页 |
·对Lucene的原理分析与研究 | 第47-57页 |
·Lucene建立索引的过程分析 | 第47-52页 |
·Lucene对建立好的索引进行搜索的方法 | 第52-54页 |
·Lucene对搜索结果的处理方法 | 第54-57页 |
·针对主题搜索引擎而对Lucene进行的定制 | 第57-63页 |
·对返回搜索结果的排序和过滤规则的定制 | 第57-59页 |
·在关键词划分时进行筛选和过滤方法的定制 | 第59-61页 |
·对查询语句的一些中文优化 | 第61-63页 |
·本章小结 | 第63-65页 |
第五章 主题搜索引擎的实现与测试 | 第65-75页 |
·信息搜集的实现过程 | 第65-68页 |
·信息搜索查询的实现 | 第68-70页 |
·针对散文主题的搜索过滤方法 | 第70-71页 |
·主题搜索引擎的功能测试 | 第71-74页 |
·本章小结 | 第74-75页 |
第六章 结束语 | 第75-77页 |
·完成的工作 | 第75页 |
·需要改进和继续研究的地方 | 第75-77页 |
参考文献 | 第77-79页 |
致谢 | 第79-81页 |
作者简介 | 第81页 |