摘要 | 第3-4页 |
ABSTRACT | 第4页 |
第一章 绪论 | 第7-10页 |
1.1 前言 | 第7-8页 |
1.2 国内外研究现状 | 第8-9页 |
1.3 本文研究内容与创新 | 第9页 |
1.4 本文组织结构 | 第9-10页 |
第二章 云计算和海量数据挖掘技术的概述 | 第10-17页 |
2.1 云计算 | 第10-12页 |
2.1.1 云计算的概念 | 第10页 |
2.1.2 云计算的基本原理 | 第10页 |
2.1.3 云计算的体系架构 | 第10-11页 |
2.1.4 云计算的关键技术 | 第11-12页 |
2.2 数据挖掘 | 第12-16页 |
2.2.1 数据挖掘的现状及前景 | 第12-13页 |
2.2.2 数据挖掘的经典算法 | 第13-15页 |
2.2.3 数据挖掘的应用 | 第15-16页 |
2.3 本章小结 | 第16-17页 |
第三章 基于云计算的数据挖掘算法 | 第17-25页 |
3.1 云计算支持下的数据挖掘算法的来源 | 第17页 |
3.2 MapReduce为基础的传统K-Means算法 | 第17-21页 |
3.3 HADOOP MapRuduce编程模型 | 第21-24页 |
3.3.1 MapRuduce编程模型原理 | 第21页 |
3.3.2 MapReduce执行过程 | 第21-22页 |
3.3.3 Hadoop MapRduce模式 | 第22-24页 |
3.4 本章小结 | 第24-25页 |
第四章 基于云计算的Hadoop平台下的数据挖掘的优化 | 第25-36页 |
4.1 Hadoop的背景及处理海量数据的优势 | 第25-26页 |
4.2 分布式文件系统HDFS | 第26-27页 |
4.3 并行计算模型MapRuduce | 第27-28页 |
4.4 基于HADOOP平台下的挖掘算法的优化 | 第28-35页 |
4.4.1 系统架构介绍 | 第28-29页 |
4.4.2 系统设计原则 | 第29-30页 |
4.4.3 基于K-Means算法在云计算平台上的优化设计 | 第30-35页 |
4.4.3.1 Map函数的设计 | 第31-33页 |
4.4.3.2 Combine函数的设计 | 第33页 |
4.4.3.3 Reduce函数的设计 | 第33-34页 |
4.4.3.4 基于K-Means算法的优化设计 | 第34-35页 |
4.5 传统的K-Means算法与优化后的K-Means算法的对比分析 | 第35页 |
4.6 本章小结 | 第35-36页 |
第五章 实验结果评测及分析 | 第36-43页 |
5.1 测试环境 | 第36-39页 |
5.1.1 JDK配置 | 第36-37页 |
5.1.2 SSH配置 | 第37页 |
5.1.3 Hadoop的安装和配置 | 第37-39页 |
5.2 试验分析 | 第39-42页 |
5.2.1 试验数据 | 第39-41页 |
5.2.2 实验结果 | 第41-42页 |
5.3 本章小结 | 第42-43页 |
第六章 总结与展望 | 第43-44页 |
6.1 本文总结 | 第43页 |
6.2 工作展望 | 第43-44页 |
参考文献 | 第44-46页 |
个人简历 在读期间发表的学术论文 | 第46-47页 |
致谢 | 第47页 |