关联规则挖掘的并行化算法研究

摘要	第5-6页
Abstract	第6-7页
第一章绪论	第10-16页
1.1 研究背景	第10-11页
1.2 国内外研究现状	第11-13页
1.2.1 关联规则挖掘算法	第11-12页
1.2.2 基于CPU的关联规则并行挖掘	第12页
1.2.3 基于GPU的关联规则并行挖掘	第12页
1.2.4 分布式环境下的关联规则并行挖掘	第12-13页
1.3 论文研究目的及主要工作	第13页
1.4 论文组织结构	第13-16页
第二章关联规则挖掘算法的并行化	第16-26页
2.1 关联规则挖掘概述	第16-18页
2.1.1 关联规则	第16页
2.1.2 关联规则挖掘	第16-17页
2.1.3 关联规则挖掘算法	第17-18页
2.2 并行计算和并行算法	第18-19页
2.2.1 并行计算	第18页
2.2.2 并行算法	第18页
2.2.3 关联规则并行挖掘算法	第18-19页
2.3 MapReduce编程模型和Spark计算框架	第19-20页
2.3.1 MapReduce相关技术综述	第19页
2.3.2 Spark计算框架	第19-20页
2.4 GPU体系架构和CUDA并行计算	第20-25页
2.4.1 CPU和GPU	第20-22页
2.4.2 GPGPU和CUDA简介	第22-25页
2.5 本章小结	第25-26页
第三章基于Spark的并行关联规则算法研究	第26-38页
3.1 FP-growth算法	第26-27页
3.2 FP-growth算法的扩展化方案	第27-30页
3.2.1 并行投影	第27-28页
3.2.2 划分投影	第28-29页
3.2.3 水平切分	第29-30页
3.3 分组算法	第30-32页
3.3.1 简单分组算法和数据倾斜	第30-31页
3.3.2 负载均衡的分组算法	第31-32页
3.4 Topk聚集	第32-33页
3.5 FP-growth算法的Spark实现	第33-36页
3.5.1 算法概要	第33-35页
3.5.2 具体实现	第35-36页
3.6 本章小结	第36-38页
第四章基于Spark-GPU的并行关联规则算法研究	第38-48页
4.1 MapReduce和GPU的结合	第38页
4.2 Spark融入GPU并行架构	第38-39页
4.3 GPU并行Apriori算法	第39-45页
4.3.1 Apriori算法	第39页
4.3.2 位表矩阵存储结构	第39-41页
4.3.3 基于位表矩阵的候选项集生成	第41-43页
4.3.4 基于位表矩阵的频繁项集生成	第43-44页
4.3.5 算法整体流程和性能分析	第44-45页
4.4 Spark-GPU并行Apriori算法	第45-47页
4.4.1 集群架构	第45-46页
4.4.2 Spark执行流程	第46-47页
4.5 本章小结	第47-48页
第五章性能测试和实验结果	第48-54页
5.1 实验环境	第48-49页
5.2 测试方法	第49页
5.3 基准测试数据集	第49-50页
5.4 实验结果与分析	第50-53页
5.4.1 速度性能测试	第50-52页
5.4.2 集群核数的扩展性测试	第52-53页
5.5 本章小结	第53-54页
第六章总结与展望	第54-56页
6.1 总结	第54页
6.2 展望	第54-56页
致谢	第56-58页
参考文献	第58-62页
论文发表情况	第62页