| 中文摘要 | 第1-5页 |
| ABSTRACT | 第5-9页 |
| 第一章 引言 | 第9-14页 |
| ·数据挖掘 | 第9-11页 |
| ·基本概念 | 第9页 |
| ·数据挖掘方法 | 第9-11页 |
| ·数据挖掘应用 | 第11页 |
| ·关联规则与MapReduce | 第11-12页 |
| ·主要研究内容 | 第12-13页 |
| ·论文组织结构 | 第13-14页 |
| 第二章 频繁模式与Hadoop | 第14-23页 |
| ·频繁模式挖掘与关联规则 | 第14页 |
| ·约束频繁模式树(CFP-Tree) | 第14-15页 |
| ·数据迁移 | 第15-16页 |
| ·云计算平台与MapReduce编程模型 | 第16-18页 |
| ·云计算平台 | 第16-17页 |
| ·MapReduce编程模型 | 第17-18页 |
| ·Hadoop | 第18-21页 |
| ·Hadoop与HDFS | 第18-19页 |
| ·MapReduce作业运行机制 | 第19-21页 |
| ·MapReduce调度算法 | 第21页 |
| ·本章小结 | 第21-23页 |
| 第三章 约束频繁模式挖掘算法的并行化及实现 | 第23-41页 |
| ·引言 | 第23页 |
| ·相关工作分析 | 第23-26页 |
| ·经典串行算法 | 第23-24页 |
| ·分布式与并行化算法 | 第24-26页 |
| ·约束频繁模式挖掘算法的并行化 | 第26-28页 |
| ·基于MapReduce的约束频繁模式并行挖掘 | 第28-30页 |
| ·基于MapReduce的约束频繁模式并行挖掘算法(PACFP) | 第30-33页 |
| ·并行化计数过程 | 第30-31页 |
| ·并行化CFP-Growth | 第31-32页 |
| ·结果聚合 | 第32-33页 |
| ·负载均衡 | 第33-34页 |
| ·实验结果及分析 | 第34-40页 |
| ·最小支持度 | 第34-35页 |
| ·可伸缩性 | 第35-37页 |
| ·可扩展性 | 第37-38页 |
| ·约束判断的代价分析 | 第38页 |
| ·负载均衡 | 第38-40页 |
| ·本章小结 | 第40-41页 |
| 第四章 频繁模式并行化生成中的重定向任务调度 | 第41-49页 |
| ·引言 | 第41页 |
| ·相关工作分析 | 第41-42页 |
| ·重定向任务调度算法 | 第42-45页 |
| ·提出问题 | 第42页 |
| ·数据本地化的重要性 | 第42-43页 |
| ·计算响应时间 | 第43-44页 |
| ·重定向算法的设计 | 第44-45页 |
| ·实验结果及分析 | 第45-48页 |
| ·有效性 | 第45-46页 |
| ·可扩展性 | 第46-47页 |
| ·稳定性 | 第47-48页 |
| ·本章小结 | 第48-49页 |
| 第五章 总结与展望 | 第49-51页 |
| ·总结 | 第49-50页 |
| ·展望 | 第50-51页 |
| 参考文献 | 第51-55页 |
| 致谢 | 第55-56页 |
| 研究生期间发表论文及参与项目情况 | 第56-57页 |
| 个人简介与联系方式 | 第57-58页 |