企业级海量数据搜索引擎相关技术实现与优化

摘要	第5-7页
Abstract	第7-8页
第一章前言	第11-21页
1.1 项目的背景和意义	第11-12页
1.2 国内外研究开发现状分析	第12-18页
1.3 项目主要工作与贡献	第18-20页
1.4 论文组织结构	第20-21页
第二章相关技术分析	第21-28页
2.1 整体方案分析	第21-22页
2.2 涉及相关技术	第22-28页
2.2.1 分布式搜索引擎	第22页
2.2.2 Hadoop组件	第22-23页
2.2.3 Kafka	第23-24页
2.2.4 Spark Streaming	第24页
2.2.5 Apache POI	第24-25页
2.2.6 学习排序	第25-26页
2.2.7 Word to Vector	第26-28页
第三章总体需求分析	第28-34页
3.1 文档格式转换及拆分的需求分析	第28-32页
3.2 关键词提取的需求分析	第32页
3.3 摘要提取的需求分析	第32页
3.4 本章小结	第32-34页
第四章文档格式转换及拆分模块设计	第34-56页
4.1 方案概述	第34-35页
4.2 技术架构	第35-37页
4.3 操作流程图	第37-38页
4.4 数据存储设计	第38-39页
4.5 技术细节	第39-55页
4.6 本章小结	第55-56页
第五章关键词提取模块设计	第56-66页
5.1 方案概述	第56-57页
5.2 技术架构	第57页
5.3 操作流程图	第57-58页
5.4 数据存储设计	第58页
5.5 技术细节	第58-65页
5.6 本章小结	第65-66页
第六章摘要提取模块设计	第66-76页
6.1 方案概述	第66页
6.2 技术架构	第66-67页
6.3 操作流程图	第67页
6.4 数据存储设计	第67-68页
6.5 技术细节	第68-75页
6.6 本章小结	第75-76页
第七章实验与结果	第76-88页
7.1 开发及测试环境	第76页
7.2 文档格式转换及拆分测试结果	第76-81页
7.3 关键词提取和摘要提取效果展示	第81页
7.4 关键词提取测试结果	第81-85页
7.5 摘要提取测试结果	第85-88页
第八章总结与展望	第88-90页
8.1 本文总结	第88页
8.2 研究展望	第88-90页
参考文献	第90-93页
致谢	第93-94页
附件	第94页