| 摘要 | 第1-5页 |
| Abstract | 第5-8页 |
| 第一章 绪论 | 第8-11页 |
| ·搜索引擎的研究现状与发展趋势 | 第8-10页 |
| ·论文的主要研究内容 | 第10-11页 |
| 第二章 相关技术介绍 | 第11-16页 |
| ·搜索引擎系统开发存在的问题及其解决方法 | 第11页 |
| ·本系统使用的主要开源软件 | 第11-16页 |
| 第三章 系统需求和设计目标 | 第16-19页 |
| ·系统定位与目标 | 第16页 |
| ·系统功能需求 | 第16-19页 |
| 第四章 系统框架和基本流程 | 第19-24页 |
| ·系统框架与体系结构 | 第19-22页 |
| ·基本流程 | 第22-24页 |
| 第五章 模块设计与实现 | 第24-39页 |
| ·Heritrix 数据抓取模块的实现 | 第24-29页 |
| ·HTMLParser 数据预处理模块 | 第29-31页 |
| ·新闻页面 Lucene 索引与 Oracle 数据库数据生成模块 | 第31-36页 |
| ·Lucene 搜索核心处理模块 | 第36-39页 |
| 第六章 系统关键技术分析与实现 | 第39-57页 |
| ·Lucene 默认排序算法分析 | 第39-41页 |
| ·PageRank 算法分析 | 第41-42页 |
| ·改进的排序算法设计 | 第42-44页 |
| ·改进的排序算法的实现 | 第44-54页 |
| ·改进算法的效果测试 | 第54-57页 |
| 第七章 总结与展望 | 第57-58页 |
| 参考文献 | 第58-60页 |