基于MapReduce的分布式聚类算法的研究

摘要	第3-4页
Abstract	第4-5页
第一章绪论	第8-13页
1.1 课题研究背景及意义	第8-9页
1.1.1 研究背景	第8页
1.1.2 研究意义	第8-9页
1.2 课题研究现状	第9-11页
1.3 本文研究内容	第11页
1.4 论文组织结构	第11-13页
第二章相关技术概述	第13-22页
2.1 聚类分析概述	第13-16页
2.1.1 聚类分析定义	第13页
2.1.2 聚类中的距离度量	第13-14页
2.1.3 聚类结果评价	第14-15页
2.1.4 聚类的主要分类	第15-16页
2.2 并行聚类技术简介	第16-17页
2.2.1 并行计算	第16页
2.2.2 并行算法评价方法	第16-17页
2.3 Hadoop平台介绍	第17-21页
2.3.1 分布式文件系统HDFS	第18页
2.3.2 MapReduce编程模型	第18-21页
2.4 本章小结	第21-22页
第三章K-means聚类算法改进研究	第22-32页
3.1 K-means聚类算法	第22-24页
3.1.1 K-means算法思想	第22-23页
3.1.2 K-means算法性能分析	第23-24页
3.2 Canopy聚类算法	第24-25页
3.3 一趟聚类算法	第25-26页
3.4 基于Canopy与One-pass的协同K-means聚类算法	第26-31页
3.4.1 算法描述	第26-29页
3.4.2 实验结果与分析	第29-31页
3.5 本章小结	第31-32页
第四章改进K-means聚类算法并行化研究	第32-50页
4.1 K-means算法的并行化	第32-33页
4.2 最大最小距离算法	第33-34页
4.3 改进K-means聚类算法的MapReduce并行化研究	第34-42页
4.3.1 问题提出	第34-35页
4.3.2 算法思想	第35页
4.3.3 算法设计	第35-37页
4.3.4 算法实现	第37-40页
4.3.5 实验结果与分析	第40-42页
4.4 基于One-pass的K-means聚类算法并行化研究	第42-49页
4.4.1 问题提出	第42-43页
4.4.2 OPKMEANS算法并行化流程	第43-44页
4.4.3 OPKMEANS算法并行化实现	第44-47页
4.4.4 实验结果与分析	第47-49页
4.5 本章小结	第49-50页
第五章总结与展望	第50-52页
5.1 论文工作总结	第50-51页
5.2 研究展望	第51-52页
参考文献	第52-55页
致谢	第55-56页
攻读学位期间的研究成果	第56-57页