| 摘要 | 第1-3页 |
| ABSTRACT | 第3-6页 |
| 第一章 绪论 | 第6-13页 |
| ·通用搜索引擎概述 | 第6-8页 |
| ·搜索引擎的产生背景及定义 | 第6页 |
| ·搜索引擎分类 | 第6-8页 |
| ·通用搜索引擎面临的问题 | 第8页 |
| ·垂直搜索引擎的研究意义 | 第8-11页 |
| ·垂直搜索引擎的产生背景 | 第8-9页 |
| ·垂直搜索引擎的定义 | 第9页 |
| ·垂直搜索引擎的优点 | 第9-10页 |
| ·垂直搜索引擎的研究现状 | 第10-11页 |
| ·Lucene 技术的研究现状 | 第11页 |
| ·本文主要研究内容 | 第11-12页 |
| ·论文章节安排 | 第12-13页 |
| 第二章 搜索引擎和LUCENE 的技术分析 | 第13-23页 |
| ·搜索引擎的组成及工作原理 | 第13-14页 |
| ·搜索引擎的性能指标 | 第14-15页 |
| ·LUCENE技术分析 | 第15-22页 |
| ·Lucene 的系统结构 | 第15-16页 |
| ·Lucene 的数据流分析 | 第16-18页 |
| ·Lucene 的索引结构分析 | 第18-20页 |
| ·Lucene 的基础排序算法 | 第20-21页 |
| ·Lucene 的优点与不足 | 第21-22页 |
| ·本章小结 | 第22-23页 |
| 第三章 LUCENE 技术的扩展与改进 | 第23-36页 |
| ·网络爬虫HERITRIX | 第23-29页 |
| ·Heritrix 简介 | 第23页 |
| ·Heritrix 的架构设计分析 | 第23-27页 |
| ·Heritrix 的扩展与改进 | 第27-29页 |
| ·LUCENE 基础排序算法的研究与改进 | 第29-35页 |
| ·信息检索模型 | 第29-32页 |
| ·排序算法 | 第32-34页 |
| ·对Lucene 基础排序算法的改进 | 第34-35页 |
| ·本章小结 | 第35-36页 |
| 第四章 基于LUCENE 技术的垂直搜索引擎的设计与实现 | 第36-57页 |
| ·垂直搜索引擎总体系统架构 | 第36-37页 |
| ·信息采集子系统的设计与实现 | 第37-45页 |
| ·网络爬虫Heritrix 的改进与扩展 | 第37-40页 |
| ·基于网络爬虫Heritrix 的信息采集 | 第40-42页 |
| ·信息整理 | 第42-45页 |
| ·索引子系统的设计与实现 | 第45-50页 |
| ·构建专业词库 | 第45-47页 |
| ·基于Lucene 的索引构建 | 第47-48页 |
| ·基于Lucene 的索引优化分析 | 第48-50页 |
| ·查询子系统的设计与实现 | 第50-55页 |
| ·MVC 模式介绍 | 第50-51页 |
| ·基于MVC 模式的查询子系统的设计与实现 | 第51-54页 |
| ·页面优先度排序算法的实现 | 第54-55页 |
| ·本章小结 | 第55-57页 |
| 第五章 系统性能的测试与评价 | 第57-61页 |
| ·网络爬虫的性能测试 | 第57-58页 |
| ·Lucene 改进前后的网页搜索结果排序的对比分析 | 第58-59页 |
| ·本章小结 | 第59-61页 |
| 第六章 结论与展望 | 第61-63页 |
| ·全文工作总结 | 第61页 |
| ·展望 | 第61-63页 |
| 参考文献 | 第63-65页 |
| 致谢 | 第65-66页 |
| 附录 | 第66-74页 |
| 个人简历 | 第74页 |
| 在学期间发表的学术论文与研究成果 | 第74-75页 |