基于Spark的数据处理分析系统的设计与实现

致谢	第5-6页
摘要	第6-7页
ABSTRACT	第7-8页
1 引言	第12-16页
1.1 研发背景	第12-13页
1.2 项目来源	第13页
1.3 项目研发的意义	第13-14页
1.4 本人在项目中的工作	第14页
1.5 本文研究内容与组织结构	第14-16页
2 相关理论与技术介绍	第16-24页
2.1 HDFS	第16-18页
2.2 Hive	第18-19页
2.3 Spark	第19-23页
2.3.1 Spark体系结构	第19-20页
2.3.2 Spark应用开发	第20-23页
2.4 本章小结	第23-24页
3 系统需求分析	第24-30页
3.1 系统概述	第24-25页
3.2 功能性需求	第25-28页
3.2.1 数据处理	第25-26页
3.2.2 数据查询分析	第26-27页
3.2.3 数据建模分析	第27-28页
3.3 非功能性需求	第28-29页
3.3.1 性能需求	第28页
3.3.2 易用性	第28-29页
3.3.3 安全性	第29页
3.3.4 可扩展性	第29页
3.4 本章小结	第29-30页
4 系统概要设计	第30-38页
4.1 系统总体设计架构	第30-33页
4.2 数据库设计	第33-37页
4.3 本章小结	第37-38页
5 数据处理模块的设计与实现	第38-62页
5.1 HDFS列表的设计与实现	第38-42页
5.1.1 HDFS列表流程设计	第38-39页
5.1.2 HDFS列表实现	第39-42页
5.1.3 HDFS列表界面展示	第42页
5.2 数据添加的设计与实现	第42-46页
5.2.1 数据添加流程设计	第42-44页
5.2.2 数据添加实现	第44-46页
5.2.3 数据添加界面展示	第46页
5.3 数据清洗的设计与实现	第46-53页
5.3.1 数据清洗流程设计	第47-48页
5.3.2 数据清洗关键算法设计	第48-51页
5.3.3 数据清洗实现	第51-53页
5.3.4 数据清洗界面展示	第53页
5.4 数据合并的设计与实现	第53-57页
5.4.1 数据合并流程设计	第54-55页
5.4.2 数据合并实现	第55-56页
5.4.3 数据合并界面展示	第56-57页
5.5 数据类型管理的设计与实现	第57-61页
5.5.1 数据类型管理流程设计	第57-59页
5.5.2 数据类型管理实现	第59-60页
5.5.3 数据类型管理界面展示	第60-61页
5.6 本章小结	第61-62页
6 系统部署与测试	第62-74页
6.1 系统架构部署	第62-63页
6.1.1 硬件环境	第62页
6.1.2 Hadoop环境搭建	第62-63页
6.1.3 Spark环境搭建	第63页
6.2 系统测试	第63-73页
6.2.1 功能测试	第64-65页
6.2.2 性能测试	第65-71页
6.2.3 测试结果与分析	第71-73页
6.3 本章小结	第73-74页
7 总结与展望	第74-76页
7.1 工作总结	第74页
7.2 工作展望	第74-76页
参考文献	第76-78页
作者简历	第78-82页
学位论文数据集	第82页