| 摘要 | 第5-6页 |
| ABSTRACT | 第6-7页 |
| 第一章 引言 | 第10-16页 |
| 1.1 项目研究背景 | 第10页 |
| 1.2 传统数据处理方式的弊端 | 第10-12页 |
| 1.3 项目研究内容与意义 | 第12-13页 |
| 1.4 本人在项目中的工作 | 第13-14页 |
| 1.5 本文组织结构 | 第14页 |
| 1.6 本章小结 | 第14-16页 |
| 第二章相关技术简介 | 第16-20页 |
| 2.1 分布式文件系统HDFS | 第16-17页 |
| 2.2 SPARK计算框架 | 第17-18页 |
| 2.3 SPARK SQL组件 | 第18页 |
| 2.4 Linux Shell编程 | 第18-19页 |
| 2.5 本章小结 | 第19-20页 |
| 第三章 平台需求分析 | 第20-34页 |
| 3.1 平台概述 | 第20-21页 |
| 3.2 平台业务功能需求说明 | 第21-31页 |
| 3.2.1 解析数据说明 | 第21-24页 |
| 3.2.2 数据解析功能模块 | 第24-28页 |
| 3.2.3 数据查询分析功能模块 | 第28-31页 |
| 3.3 非功能性需求 | 第31-32页 |
| 3.3.1 性能需求 | 第31-32页 |
| 3.3.2 易用性 | 第32页 |
| 3.3.3 可扩展性 | 第32页 |
| 3.4 本章小结 | 第32-34页 |
| 第四章 业务功能的设计与实现 | 第34-66页 |
| 4.1 数据解析的功能实现 | 第34-53页 |
| 4.1.1 MRO和MRS文件格式内容的研究 | 第34-36页 |
| 4.1.2 MRO数据解析的功能实现 | 第36-42页 |
| 4.1.3 MRO数据解析的算法调优 | 第42-46页 |
| 4.1.4 MRS数据解析的功能实现 | 第46-50页 |
| 4.1.5 MRS数据解析的算法调优 | 第50-53页 |
| 4.2 数据查询分析的功能实现 | 第53-62页 |
| 4.2.1 干扰矩阵的建立实现 | 第53-57页 |
| 4.2.2 深度覆盖模块的实现 | 第57-60页 |
| 4.2.3 重叠覆盖模块的实现 | 第60-62页 |
| 4.3 自动化脚本的功能实现 | 第62-64页 |
| 4.3.1 数据解析模块的智能化脚本设计和实现 | 第62-64页 |
| 4.3.2 数据查询分析模块的智能化脚本设计和实现 | 第64页 |
| 4.4 本章小结 | 第64-66页 |
| 第五章 开发生产环境部署和运行性能评估 | 第66-81页 |
| 5.1 生产环境部署 | 第66-72页 |
| 5.1.1 硬件环境 | 第66页 |
| 5.1.2 软件环境 | 第66页 |
| 5.1.3 Hadoop环境搭建 | 第66-69页 |
| 5.1.4 Spark环境搭建 | 第69-71页 |
| 5.1.5 HIVE环境搭建 | 第71-72页 |
| 5.2 开发环境部署 | 第72-76页 |
| 5.3 平台运行性能评估 | 第76-80页 |
| 5.4 本章小结 | 第80-81页 |
| 总结与展望 | 第81-83页 |
| 6.1 工作总结 | 第81页 |
| 6.2 研究展望 | 第81-83页 |
| 参考文献 | 第83-84页 |
| 致谢 | 第84-85页 |
| 附件 | 第85页 |