面向大规模数据集的自适应聚类算法并行化研究

摘要	第3-5页
Abstract	第5-6页
第1章绪论	第9-16页
1.1 研究背景	第9-10页
1.2 研究意义	第10-11页
1.3 国内外研究现状	第11-13页
1.3.1 国内研究现状	第11-12页
1.3.2 国外研究现状	第12-13页
1.4 研究内容及创新点	第13-14页
1.4.1 研究内容	第13-14页
1.4.2 主要创新点	第14页
1.5 论文组织结构	第14-15页
1.6 本章小结	第15-16页
第2章相关技术概述	第16-29页
2.1 大规模数据集	第16-18页
2.1.1 大规模数据集主要相关技术	第16-17页
2.1.2 大规模数据集聚类的应用领域	第17-18页
2.2 聚类分析	第18-20页
2.2.1 定义	第18页
2.2.2 聚类算法分类	第18-20页
2.3 抽样划分聚类通用框架	第20-22页
2.3.1 抽样概述	第20-21页
2.3.2 抽样划分聚类	第21-22页
2.4 Hadoop分布式平台	第22-26页
2.4.1 Hadoop架构	第22-23页
2.4.2 Map Reduce编程模型	第23-26页
2.5 Spark计算框架	第26-27页
2.5.1 Spark体系结构	第26-27页
2.5.2 Spark设计思想	第27页
2.5.3 弹性分布式数据集RDD	第27页
2.6 本章小结	第27-29页
第3章基于Map Reduce模型的并行化聚类算法	第29-40页
3.1 引言	第29页
3.2 K-means及Canopy算法	第29-31页
3.2.1 K-means算法	第29-30页
3.2.2 Canopy算法	第30-31页
3.3 面向大规模数据集的BCK-means算法	第31-36页
3.3.1 基于Map Reduce模型的BCK-means并行算法设计	第32-35页
3.3.2 基于Map Reduce模型的BCK-means并行算法实现	第35-36页
3.4 实验设计与分析	第36-39页
3.4.1 实验部署	第36-37页
3.4.2 实验结果及分析	第37-39页
3.5 本章小结	第39-40页
第4章基于Spark平台的并行化聚类算法	第40-50页
4.1 引言	第40页
4.2 粒子群算法	第40-44页
4.2.1 算法思想	第40-41页
4.2.2 算法框架	第41-42页
4.2.3 动态粒子群算法	第42-44页
4.3 面向大规模数据集的ds PSOK-means并行化算法	第44-46页
4.3.1 基于Spark的ds PSOK-means并行化架构	第45-46页
4.3.2 基于Spark的ds PSOK-means并行化算法	第46页
4.4 实验设计与分析	第46-49页
4.4.1 实验部署	第46-47页
4.4.2 实验过程及结果分析	第47-49页
4.5 本章小结	第49-50页
第5章总结与展望	第50-52页
5.1 总结	第50页
5.2 展望	第50-52页
参考文献	第52-55页
在读期间发表的学术论文及研究成果	第55-56页
致谢	第56页