中文摘要 | 第4-6页 |
ABSTRACT | 第6-7页 |
第一章 绪论 | 第11-27页 |
1.1 大数据挖掘及应用 | 第11-20页 |
1.1.1 大数据及其应用 | 第11-14页 |
1.1.2 大数据挖掘 | 第14-16页 |
1.1.3 集群系统与并行计算模型 | 第16-18页 |
1.1.4 智能制造 | 第18-20页 |
1.2 关联规则挖掘及研究动态 | 第20-24页 |
1.2.1 关联规则挖掘 | 第20-21页 |
1.2.2 关联规则并行/分布式挖掘 | 第21-22页 |
1.2.3 关联规则与智能制造 | 第22-24页 |
1.3 研究目标与研究内容 | 第24-27页 |
第二章 关联规则与并行计算模型 | 第27-37页 |
2.1 关联规则 | 第27-29页 |
2.1.1 基本概念 | 第27-28页 |
2.1.2 典型频繁模式挖掘算法分析 | 第28-29页 |
2.2 并行计算模型 | 第29-36页 |
2.2.1 Hadoop | 第29-33页 |
2.2.2 Spark | 第33-36页 |
2.3 本章小结 | 第36-37页 |
第三章 Hadoop环境下的频繁项集并行挖掘 | 第37-57页 |
3.1 引言 | 第37页 |
3.2 相关工作 | 第37-38页 |
3.3 FIUT算法描述 | 第38-39页 |
3.4 FiDoop概述 | 第39-43页 |
3.5 基于MapReduce的FiDoop算法 | 第43-47页 |
3.5.1 第一个MapReduce | 第43页 |
3.5.2 第二个MapReduce | 第43-44页 |
3.5.3 第三个MapReduce | 第44-47页 |
3.6 实现细节 | 第47-48页 |
3.6.1 负载均衡 | 第47-48页 |
3.6.2 高维优化 | 第48页 |
3.7 FiDoop-HD | 第48-50页 |
3.8 实验评价 | 第50-55页 |
3.8.1 最小支持度 | 第51-52页 |
3.8.2 负载均衡 | 第52-53页 |
3.8.3 加速比 | 第53-54页 |
3.8.4 可扩展性 | 第54-55页 |
3.9 本章小节 | 第55-57页 |
第四章 并行频繁项集挖掘数据划分策略 | 第57-79页 |
4.1 引言 | 第57-60页 |
4.1.1 研究动机 | 第57-58页 |
4.1.2 FiDoop-DP要解决的数据划分问题 | 第58-59页 |
4.1.3 基本思想 | 第59-60页 |
4.2 并行Fp-Growth算法 | 第60-61页 |
4.3 相关工作 | 第61-63页 |
4.3.1 MapReduce下的数据划分 | 第61-62页 |
4.3.2 应用相关的数据划分 | 第62-63页 |
4.4 问题陈述 | 第63-64页 |
4.4.1 基本方法与问题陈述 | 第63-64页 |
4.4.2 设计目标 | 第64页 |
4.5 数据划分策略 | 第64-68页 |
4.5.1 距离度量 | 第65-66页 |
4.5.2 K-means种子点的选择 | 第66页 |
4.5.3 划分策略 | 第66-68页 |
4.6 实现细节 | 第68-71页 |
4.7 实验评价 | 第71-77页 |
4.7.1 种子点个数对算法的影响 | 第72-73页 |
4.7.2 最小支持度对算法的影响 | 第73-74页 |
4.7.3 数据特征对算法的影响 | 第74-76页 |
4.7.4 加速比 | 第76-77页 |
4.7.5 可扩展性 | 第77页 |
4.8 本章小结 | 第77-79页 |
第五章 基于Spark内存计算的并行频繁项集挖掘算法 | 第79-89页 |
5.1 引言 | 第79-80页 |
5.2 频繁项集挖掘算法的并行化 | 第80-81页 |
5.3 Fp-Growth算法的并行化分析 | 第81-82页 |
5.4 Spark环境下的均衡Fp-Growth算法 | 第82-85页 |
5.4.1 负载均衡的分组策略 | 第82-83页 |
5.4.2 基于Spark的负载均衡Fp-Growth并行化 | 第83-85页 |
5.5 实验评价 | 第85-88页 |
5.5.1 算法执行效率比较 | 第86-87页 |
5.5.2 加速比 | 第87-88页 |
5.5.3 可扩展性 | 第88页 |
5.6 本章小结 | 第88-89页 |
第六章 基于关联规则的冷轧辊加工质量分析原型系统 | 第89-105页 |
6.1 引言 | 第89-90页 |
6.2 系统需求与总体设计 | 第90-94页 |
6.2.1 轧辊生产工艺流程 | 第90-92页 |
6.2.2 冷轧辊生产质量管理特点 | 第92-93页 |
6.2.3 系统的软件体系结构及功能 | 第93-94页 |
6.3 数据预处理及关键技术 | 第94-98页 |
6.3.1 数据转换 | 第94-95页 |
6.3.2 数据清理 | 第95-96页 |
6.3.3 数据离散化 | 第96-98页 |
6.4 提取关联规则 | 第98-99页 |
6.5 系统实现及运行结果 | 第99-103页 |
6.6 本章小结 | 第103-105页 |
第七章 总结与展望 | 第105-107页 |
7.1 总结 | 第105页 |
7.2 展望 | 第105-107页 |
参考文献 | 第107-119页 |
致谢 | 第119-121页 |
附录1 冷轧辊加工数据 | 第121-122页 |
附录2 冷轧辊加工数据预处理格式 | 第122-123页 |
攻读学位期间发表的学术论文和参加的科研项目 | 第123页 |