中文摘要 | 第1-5页 |
ABSTRACT | 第5-9页 |
第一章 引言 | 第9-14页 |
·数据挖掘 | 第9-11页 |
·基本概念 | 第9页 |
·数据挖掘方法 | 第9-11页 |
·数据挖掘应用 | 第11页 |
·关联规则与MapReduce | 第11-12页 |
·主要研究内容 | 第12-13页 |
·论文组织结构 | 第13-14页 |
第二章 频繁模式与Hadoop | 第14-23页 |
·频繁模式挖掘与关联规则 | 第14页 |
·约束频繁模式树(CFP-Tree) | 第14-15页 |
·数据迁移 | 第15-16页 |
·云计算平台与MapReduce编程模型 | 第16-18页 |
·云计算平台 | 第16-17页 |
·MapReduce编程模型 | 第17-18页 |
·Hadoop | 第18-21页 |
·Hadoop与HDFS | 第18-19页 |
·MapReduce作业运行机制 | 第19-21页 |
·MapReduce调度算法 | 第21页 |
·本章小结 | 第21-23页 |
第三章 约束频繁模式挖掘算法的并行化及实现 | 第23-41页 |
·引言 | 第23页 |
·相关工作分析 | 第23-26页 |
·经典串行算法 | 第23-24页 |
·分布式与并行化算法 | 第24-26页 |
·约束频繁模式挖掘算法的并行化 | 第26-28页 |
·基于MapReduce的约束频繁模式并行挖掘 | 第28-30页 |
·基于MapReduce的约束频繁模式并行挖掘算法(PACFP) | 第30-33页 |
·并行化计数过程 | 第30-31页 |
·并行化CFP-Growth | 第31-32页 |
·结果聚合 | 第32-33页 |
·负载均衡 | 第33-34页 |
·实验结果及分析 | 第34-40页 |
·最小支持度 | 第34-35页 |
·可伸缩性 | 第35-37页 |
·可扩展性 | 第37-38页 |
·约束判断的代价分析 | 第38页 |
·负载均衡 | 第38-40页 |
·本章小结 | 第40-41页 |
第四章 频繁模式并行化生成中的重定向任务调度 | 第41-49页 |
·引言 | 第41页 |
·相关工作分析 | 第41-42页 |
·重定向任务调度算法 | 第42-45页 |
·提出问题 | 第42页 |
·数据本地化的重要性 | 第42-43页 |
·计算响应时间 | 第43-44页 |
·重定向算法的设计 | 第44-45页 |
·实验结果及分析 | 第45-48页 |
·有效性 | 第45-46页 |
·可扩展性 | 第46-47页 |
·稳定性 | 第47-48页 |
·本章小结 | 第48-49页 |
第五章 总结与展望 | 第49-51页 |
·总结 | 第49-50页 |
·展望 | 第50-51页 |
参考文献 | 第51-55页 |
致谢 | 第55-56页 |
研究生期间发表论文及参与项目情况 | 第56-57页 |
个人简介与联系方式 | 第57-58页 |