摘要 | 第1-7页 |
Abstract | 第7-9页 |
第一章 绪论 | 第9-14页 |
·研究背景和意义 | 第9页 |
·国内外研究现状 | 第9-12页 |
·云计算技术研究现状 | 第9-10页 |
·数据挖掘技术的研究现状 | 第10-11页 |
·基于云计算的关联分析和模糊聚类研究现状 | 第11-12页 |
·论文的主要工作 | 第12-13页 |
·论文的组织结构 | 第13-14页 |
第二章 数据挖掘和云计算 | 第14-30页 |
·数据挖掘概述 | 第14-16页 |
·数据挖掘简介 | 第14-15页 |
·数据挖掘过程 | 第15页 |
·常见数据挖掘技术 | 第15-16页 |
·云计算概述 | 第16-17页 |
·Hadoop | 第17-18页 |
·HDFS | 第18-20页 |
·HDFS体系架构 | 第18-19页 |
·HDFS存取机制 | 第19-20页 |
·MapReduce | 第20-23页 |
·MapReduce编程模型 | 第20-21页 |
·MapReduce的执行流程 | 第21-23页 |
·MapReduce编程相关技术 | 第23-26页 |
·数据类型和格式 | 第23-24页 |
·Map类和Reduce类 | 第24-25页 |
·Job配置对象 | 第25-26页 |
·并行计算及相关知识 | 第26-28页 |
·并行计算概念和分类 | 第26页 |
·常见的并行策略 | 第26-27页 |
·并行算法的性能标准 | 第27-28页 |
·Hadoop与网格计算 | 第28页 |
·本章小结 | 第28-30页 |
第三章 Hadoop下的关联分析研究和并行改进 | 第30-42页 |
·问题的提出 | 第30页 |
·问题的定义和描述 | 第30-32页 |
·基本术语 | 第30-32页 |
·关联分析问题描述 | 第32页 |
·频繁项集的产生——Apriori算法 | 第32-34页 |
·Apriori算法 | 第32-33页 |
·Apriori算法的优势特点 | 第33-34页 |
·Apriori算法的不足 | 第34页 |
·基于Hadoop的并行改进——MRARM算法 | 第34-37页 |
·现有的Apriori改进方法分析 | 第34-35页 |
·MRARM算法改进策略 | 第35-37页 |
·MRARM算法详细设计与实现 | 第37-39页 |
·Map函数设计 | 第37页 |
·Combine函数设计 | 第37-38页 |
·Reduce函数设计 | 第38-39页 |
·MRARM算法的Job配置 | 第39页 |
·MRARM算法的应用 | 第39-41页 |
·本章小结 | 第41-42页 |
第四章 Hadoop下的模糊聚类研究和并行改进 | 第42-58页 |
·问题的提出 | 第42页 |
·问题的定义和描述 | 第42-44页 |
·聚类的定义 | 第42-43页 |
·聚类问题的描述 | 第43-44页 |
·典型的聚类和模糊聚类算法 | 第44-47页 |
·k-Means聚类算法 | 第44页 |
·模糊聚类FCM算法 | 第44-47页 |
·k-Means和FCM算法对比 | 第47页 |
·基于Hadoop的FCM并行改进——MRFCM算法 | 第47-49页 |
·MRFCM算法详细设计与实现 | 第49-53页 |
·Job1设计 | 第49-51页 |
·决策判断模块的设计 | 第51-52页 |
·Job2设计 | 第52-53页 |
·MRFCM算法的Job配置 | 第53-54页 |
·MRFCM算法的应用 | 第54-57页 |
·数据来源 | 第54-56页 |
·预处理 | 第56页 |
·MRFCM算法的应用 | 第56-57页 |
·本章小结 | 第57-58页 |
第五章 实验与评估 | 第58-74页 |
·实验环境 | 第58-62页 |
·硬件环境 | 第58页 |
·软件环境 | 第58页 |
·集群网络 | 第58-59页 |
·搭建Hadoop集群 | 第59-62页 |
·实验过程和结果评估 | 第62-72页 |
·MRARM算法实验 | 第63-67页 |
·MRFCM算法实验 | 第67-72页 |
·实验总结 | 第72页 |
·本章小结 | 第72-74页 |
第六章 总结和展望 | 第74-76页 |
·全文总结 | 第74-75页 |
·未来展望 | 第75-76页 |
参考文献 | 第76-79页 |
致谢 | 第79-81页 |
作者简介 | 第81页 |