基于Hadoop的电梯安全大数据挖掘研究

摘要	第3-4页
abstract	第4页
1 绪论	第8-12页
1.1 课题研究背景及意义	第8页
1.2 国内外研究现状	第8-10页
1.2.1 大数据研究现状	第8-9页
1.2.2 Hadoop研究现状	第9-10页
1.3 论文主要工作及组织结构	第10-12页
2 相关技术	第12-24页
2.1 Hadoop技术	第12-19页
2.1.1 Hadoop概述	第12-13页
2.1.2 分布式文件系统—HDFS	第13-14页
2.1.3 分布式数据处理—MapReduce	第14-17页
2.1.4 Hive与Sqoop	第17-19页
2.2 数据挖掘技术	第19-21页
2.2.1 数据挖掘的定义	第19-20页
2.2.2 数据挖掘的方法	第20页
2.2.3 数据挖掘的基本流程	第20-21页
2.3 数据预处理	第21-22页
2.3.1 数据清洗	第21页
2.3.2 数据集成	第21-22页
2.3.3 数据转换	第22页
2.3.4 数据规约	第22页
2.4 本章小结	第22-24页
3 基于Hadoop的数据挖掘算法分析与改进	第24-40页
3.1 K-Means算法分析与改进	第24-32页
3.1.1 K-Means算法简介	第24-25页
3.1.2 K-Means算法的改进	第25-27页
3.1.3 改进K-Means算法的MapReduce并行化	第27-32页
3.2 Apriori算法分析与改进	第32-37页
3.2.1 Apriori算法简介	第32-34页
3.2.2 基于MapReduce的Apriori算法的改进	第34-37页
3.3 算法性能评估	第37-39页
3.3.1 改进的K-Means算法性能评估	第37-38页
3.3.2 改进的Apriori算法性能评估	第38-39页
3.4 本章小结	第39-40页
4 基于Hadoop的电梯安全大数据挖掘系统总体设计	第40-46页
4.1 数据来源	第40-42页
4.2 系统结构设计	第42页
4.3 系统功能设计	第42-43页
4.4 数据仓库结构设计	第43-45页
4.5 软件及技术选择	第45页
4.6 本章小结	第45-46页
5 基于Hadoop的电梯安全大数据挖掘系统的实现	第46-59页
5.1 Hadoop平台搭建	第46-48页
5.1.1 集群规划与环境准备	第46页
5.1.2 Hadoop安装	第46-48页
5.2 数据导入导出模块的实现	第48-51页
5.2.1 数据导入模块	第48-50页
5.2.2 数据导出模块	第50-51页
5.3 数据预处理模块的实现	第51-55页
5.3.1 数据预处理分析	第51-53页
5.3.2 数据预处理模块实现	第53-55页
5.4 数据挖掘模块的实现	第55-57页
5.4.1 K-Means聚类挖掘	第55-56页
5.4.2 Apriori关联规则挖掘	第56-57页
5.5 调度模块的实现	第57-58页
5.6 本章小结	第58-59页
6 结果分析	第59-63页
6.1 聚类结果分析	第59-61页
6.2 关联规则结果分析	第61-62页
6.3 本章小结	第62-63页
7 总结与展望	第63-64页
7.1 工作总结	第63页
7.2 工作展望	第63-64页
致谢	第64-65页
参考文献	第65-68页
攻读硕士学位期间所获科研成果	第68页