摘要 | 第1-5页 |
Abstract | 第5-8页 |
第一章 绪论 | 第8-11页 |
·搜索引擎的研究现状与发展趋势 | 第8-10页 |
·论文的主要研究内容 | 第10-11页 |
第二章 相关技术介绍 | 第11-16页 |
·搜索引擎系统开发存在的问题及其解决方法 | 第11页 |
·本系统使用的主要开源软件 | 第11-16页 |
第三章 系统需求和设计目标 | 第16-19页 |
·系统定位与目标 | 第16页 |
·系统功能需求 | 第16-19页 |
第四章 系统框架和基本流程 | 第19-24页 |
·系统框架与体系结构 | 第19-22页 |
·基本流程 | 第22-24页 |
第五章 模块设计与实现 | 第24-39页 |
·Heritrix 数据抓取模块的实现 | 第24-29页 |
·HTMLParser 数据预处理模块 | 第29-31页 |
·新闻页面 Lucene 索引与 Oracle 数据库数据生成模块 | 第31-36页 |
·Lucene 搜索核心处理模块 | 第36-39页 |
第六章 系统关键技术分析与实现 | 第39-57页 |
·Lucene 默认排序算法分析 | 第39-41页 |
·PageRank 算法分析 | 第41-42页 |
·改进的排序算法设计 | 第42-44页 |
·改进的排序算法的实现 | 第44-54页 |
·改进算法的效果测试 | 第54-57页 |
第七章 总结与展望 | 第57-58页 |
参考文献 | 第58-60页 |