基于MapReduce的K-Medoids并行算法研究

致谢	第1-5页
摘要	第5-6页
Abstract	第6-9页
1 绪论	第9-17页
·课题的研究背景	第9-10页
·国内外研究现状	第10-12页
·课题的研究内容	第12-15页
·论文结构	第15-17页
2 聚类算法与Hadoop基础理论	第17-33页
·聚类算法	第17-21页
·聚类算法的概念	第17-18页
·聚类方法的分类	第18-19页
·K-Means和K-Medoids算法分析	第19-21页
·Top-K和聚类分析抽样算法	第21-23页
·Top-K算法	第21-22页
·聚类分析中的抽样算法	第22-23页
·Hadoop基础理论	第23-32页
·HDFS文件系统	第23-28页
·MapReduce编程模型	第28-31页
·Hadoop的运行模式	第31-32页
·本章小结	第32-33页
3 基于MapReduce的改进的K-Medoids算法	第33-44页
·传统K-Medoids算法的不足	第33-35页
·改进的K-Medoids算法	第35-43页
·基于Top-K的并行随机采样	第35-36页
·改进的K-Medoids算法设计方案	第36-40页
·新K-Medoids算法描述	第40-43页
·本章小结	第43-44页
4 基于MapReduce的改进K-Medoids算法的实验结果与分析	第44-63页
·实验环境	第44-49页
·实验环境准备	第44-45页
·Hadoop平台的搭建	第45-49页
·单机实验结果及分析	第49-54页
·单机收敛速度对比	第49-50页
·单机数据负载能力实验	第50-52页
·标准数据集对比实验	第52-54页
·集群测试	第54-59页
·随机采样对比实验	第54-55页
·海量数据集对比试验	第55-56页
·集群负载能力分析	第56-58页
·加速比分析	第58-59页
·Hadoop平台优化测试	第59-61页
·基于HDFS的数据分片调整实验	第59-60页
·基于MapReduce的计算流程优化实验	第60-61页
·本章小结	第61-63页
结论	第63-65页
参考文献	第65-69页
作者简历	第69-71页
学位论文数据集	第71页