Hadoop平台下基于密度的K-Medoids聚类算法的研究与实现

摘要	第3-4页
ABSTRACT	第4页
第1章绪论	第7-13页
1.1 研究背景及意义	第7-8页
1.2 K-Medoids聚类研究现状	第8-10页
1.3 Hadoop发展现状	第10页
1.4 论文主要研究内容	第10-11页
1.5 论文组织结构	第11页
1.6 本章小结	第11-13页
第2章云计算平台介绍	第13-24页
2.1 云计算概述	第13-15页
2.2 Hadoop平台	第15-17页
2.2.1 Hadoop平台概述	第15-16页
2.2.2 Hadoop工作模式	第16-17页
2.3 Hadoop分布式文件系统	第17-19页
2.4 MapReduce编程模型	第19-22页
2.5 Hadoop数据类型	第22-23页
2.6 本章小结	第23-24页
第3章基于密度的K-Medoids算法	第24-29页
3.1 相关概念介绍	第24-25页
3.2 传统的K-Medoids算法	第25-26页
3.2.1 K-Medoids算法流程	第25-26页
3.2.2 K-Medoids算法优缺点	第26页
3.3 基于密度的K-Medoids算法的改进	第26-28页
3.3.1 K-Medoids算法改进思路	第26-27页
3.3.2 基于密度的K-Medoids算法流程	第27-28页
3.4 本章小结	第28-29页
第4章基于密度的K-Medoids算法MapReduce化	第29-42页
4.1 算法的并行化分析	第29页
4.2 算法的MapReduce化策略	第29-30页
4.3 算法的MapReduce化过程	第30-41页
4.3.1 Job1的Map和Reduce函数设计	第30-32页
4.3.2 Job2的Map和Reduce函数设计	第32-34页
4.3.3 Job3的Map和Reduce函数设计	第34-36页
4.3.4 Job4的Map和Reduce函数设计	第36-38页
4.3.5 Job5的Map和Reduce函数设计	第38-39页
4.3.6 Job6的Map和Reduce函数设计	第39-41页
4.4 本章小结	第41-42页
第5章算法对比实验及结果分析	第42-52页
5.1 实验环境的搭建	第42-45页
5.1.1 硬件和软件环境	第42页
5.1.2 Hadoop的安装和配置	第42-45页
5.2 改进算法的对比测试与结果分析	第45-51页
5.2.1 测试数据集简介	第45-46页
5.2.2 测试指标	第46页
5.2.3 基于Hadoop下算法的聚类效果的对比测试	第46-50页
5.2.4 基于Hadoop下算法的时间性能测试	第50-51页
5.3 本章小结	第51-52页
第6章结论与展望	第52-53页
致谢	第53-54页
参考文献	第54-57页
攻读学位期间的研究成果	第57页