云计算环境下的模式挖掘算法研究

摘要	第1-4页
ABSTRACT	第4-9页
1 绪论	第9-14页
·论文研究背景和意义	第9-10页
·国内外研究现状和发展趋势	第10-11页
·本文的研究内容与主要贡献	第11-12页
·主要研究内容	第11-12页
·主要贡献	第12页
·论文组织结构	第12-14页
2 模式挖掘	第14-25页
·频繁模式挖掘定义	第14-15页
·经典频繁模式挖掘算法	第15-20页
·效用模式挖掘的产生和具体定义	第20-22页
·效用模式挖掘的产生	第20页
·效用模式挖掘的定义	第20-22页
·经典效用模式挖掘算法	第22-24页
·本章小结	第24-25页
3 分布式并行计算模型MapReduce和Spark	第25-37页
·并行计算模型MapReduce	第25-28页
·Hadoop的产生	第25-26页
·MapReduce的编程模型	第26-27页
·MapReduce的工作原理	第27-28页
·并行计算模型Spark	第28-34页
·Spark的产生	第28-29页
·弹性分布式数据集RDD	第29-33页
·Spark集群	第33-34页
·MapReduce和Spark的对比	第34-35页
·基于MapReduce和Spark的并行模式挖掘算法	第35-36页
·本章小结	第36-37页
4 基于MapReduce并行挖掘频繁模式的新算法Pamph	第37-57页
·混合挖掘策略	第37-41页
·混合挖掘策略的思路	第38-39页
·宽度优先挖掘到深度优先挖掘的自动转换	第39-40页
·宽度优先挖掘中使用的剪枝(prune)技术	第40-41页
·数据格式	第41-44页
·宽度优先挖掘策略中所用的数据格式mixset	第41-43页
·深度优先挖掘策略中所用的数据格式	第43页
·垂直数据格式mixset转换为水平数据格式	第43-44页
·并行挖掘算法Pamph	第44-48页
·统计一阶频繁模式作业(Job1)	第45-46页
·混合挖掘作业(Job2)	第46-48页
·小规模集群下的实验分析	第48-55页
·和已有算法DPC、PFP运行时间的对比	第48-50页
·扩展性实验	第50-51页
·Pamph算法剖析	第51-55页
·大规模集群下的实验分析	第55-56页
·本章小结	第56-57页
5 基于Spark并行挖掘效用模式的新算法Phps	第57-70页
·搜索策略	第57页
·数据结构UtilityList的改进和裁剪策略	第57-59页
·并行效用模式挖掘算法Phps	第59-65页
·算法第一阶段	第59-61页
·算法第二阶段	第61-63页
·算法第三阶段	第63-65页
·实验对比分析	第65-68页
·实验对比算法	第65-66页
·实验环境和数据集	第66-67页
·实验结果与分析	第67-68页
·本章小结	第68-70页
6 总结与展望	第70-71页
·论文总结	第70页
·未来展望	第70-71页
参考文献	第71-74页
本文作者硕士期间参加的科研项目及学术成果	第74-75页
致谢	第75-76页