基于Hadoop的海量工程数据关联规划挖掘方法研究

致谢	第5-6页
摘要	第6-7页
ABSTRACT	第7-8页
1 绪论	第12-34页
1.1 研究背景及意义	第12-13页
1.2 Hadoop技术概述	第13-21页
1.2.1 Hadoop项目及其结构组成	第14-16页
1.2.2 HDFS分布式文件系统	第16-19页
1.2.3 MapReduce并行编程框架	第19-21页
1.3 国内外研究现状	第21-31页
1.3.1 Hadoop发展现状	第21-24页
1.3.2 数据挖掘概述	第24-26页
1.3.3 关联规则挖掘算法研究现状	第26-29页
1.3.4 动车组故障诊断研究现状	第29-31页
1.4 本文研究的内容	第31-32页
1.5 章节组织	第32-34页
2 基于MapReduce的改进并行频繁模式挖掘算法	第34-50页
2.1 关联规则挖掘基本理论	第34-35页
2.2 经典关联规则挖掘算法分析	第35-40页
2.2.1 Apriori算法分析	第35-38页
2.2.2 FP-Growth算法分析	第38-40页
2.2.3 两种算法性能比较	第40页
2.3 改进的并行FP-Growth算法	第40-46页
2.3.1 必要性分析	第40-41页
2.3.2 理论基础	第41页
2.3.3 算法描述	第41-43页
2.3.4 并行计数	第43-44页
2.3.5 并行FP-Growth	第44-45页
2.3.6 频繁模式合并	第45-46页
2.4 并行FP-Growth规则优化	第46-47页
2.4.1 优化目的分析	第46-47页
2.4.2 局部FP-Tree规则优化	第47页
2.5 本章小结	第47-50页
3 基于MapReduce的多维关联规则挖掘算法	第50-58页
3.1 关联规则的分类	第50-51页
3.2 传统的并行Apriori算法分析	第51-53页
3.3 改进的并行Apriori算法	第53-56页
3.3.1 算法描述	第53-54页
3.3.2 候选项集计数	第54-55页
3.3.3 生成候选项集	第55-56页
3.4 并行Apriori连接规则优化	第56-57页
3.4.1 优化目的分析	第56页
3.4.2 并行Apriori算法规则优化	第56-57页
3.5 本章小结	第57-58页
4 改进的并行关联规则挖掘算法应用	第58-74页
4.1 数据来源	第58页
4.2 故障数据预处理	第58-60页
4.3 应用实例分析	第60-67页
4.3.1 改进的并行FP-Growth算法分析	第60-64页
4.3.2 改进的并行Apriori算法实例分析	第64-67页
4.4 算法执行时间分析	第67-69页
4.4.1 改进的并行FP-Growth算法执行时间分析	第67-68页
4.4.2 改进的并行Apriori算法执行时间分析	第68-69页
4.5 改进算法空间分析	第69-70页
4.6 改进算法的优点	第70-71页
4.6.1 改进的并行FP-Growth算法优点	第70-71页
4.6.2 改进的并行Apriori算法优点	第71页
4.7 本章小结	第71-74页
5 动车组运维数据处理平台实现	第74-84页
5.1 系统实验环境搭建与部署	第74-75页
5.2 动车组运维数据处理平台的设计	第75-80页
5.2.1 系统功能需求	第75-76页
5.2.2 系统整体架构设计	第76-77页
5.2.3 系统客户端设计	第77-80页
5.3 性能测试与结果分析	第80-83页
5.3.1 改进的并行FP-Growth算法实验测试	第80-82页
5.3.2 改进的并行Apriori算法实验测试	第82-83页
5.4 本章小结	第83-84页
6 总结与展望	第84-86页
6.1 主要工作和特点	第84-85页
6.2 进一步工作展望	第85-86页
参考文献	第86-90页
作者简历及攻读硕士学位期间取得的研究成果	第90-94页
学位论文数据集	第94页