基于ElasticSearch的分布式物流垂直搜索引擎的设计与实现
摘要 | 第4-5页 |
Abstract | 第5-6页 |
第1章 绪论 | 第10-16页 |
1.1 研究背景 | 第10-11页 |
1.2 搜索引擎的发展趋势 | 第11-12页 |
1.3 搜索引擎在物流领域的应用 | 第12-13页 |
1.4 物流垂直搜索引擎的特点 | 第13页 |
1.5 国内外代表性的垂直搜索引擎 | 第13-14页 |
1.6 研究内容和结构安排 | 第14-16页 |
第2章 相关技术概述 | 第16-25页 |
2.1 搜索引擎基本原理 | 第16页 |
2.2 搜索引擎的评价 | 第16-17页 |
2.3 Nutch技术 | 第17-20页 |
2.3.1 Nutch简介 | 第17页 |
2.3.2 Nutch框架结构 | 第17-18页 |
2.3.3 Nutch工作流程 | 第18-19页 |
2.3.4 Nutch插件机制 | 第19-20页 |
2.4 Lucene技术 | 第20-21页 |
2.4.1 Lucene简介 | 第20-21页 |
2.4.2 Lucene索引结构 | 第21页 |
2.5 ElasticSearch技术 | 第21-24页 |
2.5.1 ElasticSearch简介 | 第22页 |
2.5.2 ElasticSearch框架结构 | 第22-23页 |
2.5.3 ElasticSearch分布式原理 | 第23-24页 |
2.6 本章小结 | 第24-25页 |
第3章 系统设计 | 第25-50页 |
3.1 系统需求分析 | 第25-27页 |
3.1.1 系统设计目标 | 第25页 |
3.1.2 系统用例图和用例描述 | 第25-26页 |
3.1.3 功能及性能需求 | 第26-27页 |
3.2 系统的总体设计 | 第27-30页 |
3.2.1 系统架构 | 第27-28页 |
3.2.2 系统流程 | 第28-30页 |
3.2.3 集群架构 | 第30页 |
3.3 物流主题采集模块设计 | 第30-37页 |
3.3.1 数据采集流程 | 第30-32页 |
3.3.2 物流词典 | 第32页 |
3.3.3 初始种子URL | 第32-34页 |
3.3.4 网页遍历策略 | 第34-35页 |
3.3.5 网页解析 | 第35-36页 |
3.3.6 物流主题过滤 | 第36-37页 |
3.4 分布式索引模块设计 | 第37-43页 |
3.4.1 分布式索引集群设计 | 第37-38页 |
3.4.2 分布式哈希分片 | 第38-40页 |
3.4.3 配置分析器 | 第40-41页 |
3.4.4 中文分词 | 第41-43页 |
3.5 物流信息搜索模块设计 | 第43-48页 |
3.5.1 用户交互界面 | 第43页 |
3.5.2 分布式搜索方式 | 第43-45页 |
3.5.3 对搜索结果进行排序 | 第45-47页 |
3.5.4 高亮显示搜索结果 | 第47-48页 |
3.6 本章小结 | 第48-50页 |
第4章 系统实现 | 第50-76页 |
4.1 物流主题采集模块实现 | 第50-52页 |
4.2 分布式索引模块实现 | 第52-57页 |
4.2.1 分析器的实现 | 第53-54页 |
4.2.2 中文分词的实现 | 第54-57页 |
4.3 物流信息搜索模块的实现 | 第57-65页 |
4.3.1 用户交互界面的实现 | 第58-60页 |
4.3.2 相关性排序的实现 | 第60页 |
4.3.3 最新更新排序的实现 | 第60-61页 |
4.3.4 词频排序的实现 | 第61-63页 |
4.3.5 高亮显示的实现 | 第63-65页 |
4.4 网络爬虫Nutch的实现 | 第65-72页 |
4.4.1 Nutch配置 | 第66-68页 |
4.4.2 Nutch数据采集 | 第68-69页 |
4.4.3 Nutch数据存储 | 第69-71页 |
4.4.4 Nutch索引扩展 | 第71-72页 |
4.5 ElasticSearch集群的实现 | 第72-74页 |
4.6 系统运行效果 | 第74-75页 |
4.7 本章小结 | 第75-76页 |
第5章 基于用户兴趣的结果重排序 | 第76-86页 |
5.1 排序策略研究 | 第76-77页 |
5.2 结果重排序策略 | 第77-80页 |
5.2.1 用户兴趣模型建立 | 第77-78页 |
5.2.2 用户兴趣模型更新 | 第78-79页 |
5.2.3 重排序过程 | 第79-80页 |
5.3 基于用户兴趣重排序的算法实例分析 | 第80-84页 |
5.4 基于用户兴趣重排序的实验结果与分析 | 第84-85页 |
5.5 本章小结 | 第85-86页 |
第6章 系统测试与分析 | 第86-97页 |
6.1 实验环境 | 第86-87页 |
6.1.1 硬件配置 | 第86页 |
6.1.2 软件配置 | 第86-87页 |
6.2 实验环境搭建 | 第87-91页 |
6.2.1 Nutch集群搭建 | 第87-89页 |
6.2.2 ElasticSearch集群搭建 | 第89-91页 |
6.3 功能测试与分析 | 第91-95页 |
6.4 性能测试与分析 | 第95-96页 |
6.5 本章小结 | 第96-97页 |
第7章 总结与展望 | 第97-99页 |
7.1 本文的主要工作 | 第97页 |
7.2 未来展望 | 第97-99页 |
参考文献 | 第99-102页 |
致谢 | 第102-103页 |
攻读学位期间发表的学术论文与参加的研究工作 | 第103-104页 |