基于Lucene的旅游信息搜索引擎的设计与实现
摘要 | 第5-6页 |
ABSTRACT | 第6页 |
第一章 绪论 | 第9-17页 |
1.1 研究背景与意义 | 第9-12页 |
1.2 国内外研究现状 | 第12-15页 |
1.3 本文主要研究内容与安排 | 第15-17页 |
第二章 搜索引擎及 LUCENE 技术剖析 | 第17-30页 |
2.1 搜索引擎概况 | 第17-20页 |
2.1.1 搜索引擎的产生与框架 | 第17-19页 |
2.1.2 搜索引擎技术的发展趋势 | 第19-20页 |
2.2 搜索引擎的结构剖析 | 第20-22页 |
2.3 搜索引擎的主要技术 | 第22-29页 |
2.3.1 索引技术 | 第22-26页 |
2.3.2 检索技术 | 第26-29页 |
2.4 本章小结 | 第29-30页 |
第三章 旅游信息搜索引擎需求分析 | 第30-38页 |
3.1 背景需求分析 | 第30-33页 |
3.1.1 旅游信息采集需求 | 第30-31页 |
3.1.2 旅游信息深度挖掘需求 | 第31-32页 |
3.1.3 旅游信息实时性需求 | 第32-33页 |
3.2 旅游信息搜索引擎系统需求 | 第33-37页 |
3.2.1 功能需求 | 第33-36页 |
3.2.2 用户需求 | 第36-37页 |
3.2.3 系统环境需求 | 第37页 |
3.3 本章小结 | 第37-38页 |
第四章 旅游信息搜索引擎设计 | 第38-56页 |
4.1 旅游信息搜索引擎系统构架 | 第39-44页 |
4.1.1 系统功能设计 | 第39-40页 |
4.1.2 旅游信息搜索引擎工作流程设计 | 第40-41页 |
4.1.3 系统架构设计 | 第41-44页 |
4.2 旅游信息搜索引擎之爬虫系统的设计 | 第44-51页 |
4.2.1 爬虫框架设计 | 第45-46页 |
4.2.2 旅游信息网页抓取算法 | 第46-48页 |
4.2.3 旅游信息网页更新算法 | 第48-51页 |
4.3 旅游信息搜索引擎之总体策略 | 第51-55页 |
4.3.1 旅游信息爬行策略 | 第51-53页 |
4.3.2 旅游信息中文分词策略 | 第53-54页 |
4.3.3 旅游信息过滤策略 | 第54-55页 |
4.4 系统数据库设计 | 第55页 |
4.5 本章小结 | 第55-56页 |
第五章 旅游信息搜索引擎的实现与测试 | 第56-71页 |
5.1 搜索引擎实现思路 | 第56-58页 |
5.2 旅游信息搜索引擎各子系统的实现 | 第58-70页 |
5.2.1 旅游信息过滤的实现 | 第58-62页 |
5.2.2 旅游信息索引子系统的实现 | 第62-66页 |
5.2.3 旅游信息搜索子系统的实现 | 第66-67页 |
5.2.4 旅游信息页面去重子系统的实现 | 第67-70页 |
5.3 旅游信息搜索引擎测试与运行 | 第70页 |
5.4 本章小结 | 第70-71页 |
第六章 总结与展望 | 第71-72页 |
致谢 | 第72-73页 |
参考文献 | 第73-76页 |