基于自然邻的密度聚类算法及其并行化研究

中文摘要	第3-4页
英文摘要	第4-8页
1 绪论	第8-11页
1.1 课题研究背景	第8页
1.2 国内外研究现状	第8-9页
1.3 本文研究内容	第9-10页
1.4 本文组织架构	第10-11页
2 聚类算法的分类及现状	第11-20页
2.1 聚类分析算法概述	第11页
2.2 聚类算法的基础设计原则	第11-12页
2.3 聚类算法分类	第12-17页
2.3.1 基于划分的方法	第12-13页
2.3.2 基于层次的聚类算法	第13-14页
2.3.3 基于密度的聚类算法	第14-16页
2.3.4 基于网格的聚类算法	第16页
2.3.5 其他聚类算法	第16-17页
2.4 聚类算法中相似性度量	第17-18页
2.4.1 基于距离的相似性度量	第17-18页
2.4.2 基于相似度的相似性计算	第18页
2.5 本章小结	第18-20页
3 改进的DBSCAN算法(NN-DBSCAN)	第20-34页
3.1 基于密度的聚类算法定义	第20页
3.2 DBSCAN算法以及其步骤与分析	第20-23页
3.2.1 DBSCAN算法	第20-22页
3.2.2 DBSCAN算法分析	第22-23页
3.3 OPTICS算法	第23-25页
3.3.1 OPTICS算法	第23-25页
3.3.2 OPTICS算法分析	第25页
3.4 NN-DBSCAN算法	第25-33页
3.4.1 自然邻居搜索算法	第26-27页
3.4.2 NN-DBSCAN算法	第27-32页
3.4.3 算法分析	第32-33页
3.5 本章小结	第33-34页
4 NN-DBSCAN并行化	第34-45页
4.1 大数据	第34页
4.2 当前并行计算架构及分析	第34-35页
4.2.1 Hadoop	第34页
4.2.2 Spark	第34-35页
4.2.3 Hadoop与Spark优缺点分析	第35页
4.3 自然邻并行	第35-43页
4.3.1 kd树构建优化	第36-40页
4.3.2 自然邻居并行	第40-42页
4.3.3 并行分析	第42-43页
4.4 NN-DBSCAN并行	第43-44页
4.5 实验结果与分析	第44页
4.6 本章小结	第44-45页
5 实验与分析	第45-51页
5.1 实验	第45-50页
5.1.1 实验数据集	第45-46页
5.1.2 实验效果对比	第46-49页
5.1.3 实验时耗对比	第49-50页
5.2 分析	第50页
5.3 本章小结	第50-51页
6 总结与展望	第51-53页
6.1 全文总结	第51-52页
6.2 未来工作展望	第52-53页
致谢	第53-54页
参考文献	第54-57页
附录	第57页
A.攻读硕士期间发表的学术论文	第57页
B.作者在攻读学位期间取得的科研成果目录	第57页