半监督聚类并行化实现的研究

摘要	第3-4页
Abstract	第4-5页
第1章绪论	第8-14页
1.1 课题的研究背景及意义	第8-9页
1.2 国内外研究现状	第9-11页
1.2.1 半监督聚类研究现状	第9-10页
1.2.2 主动学习研究现状	第10-11页
1.2.3 并行计算框架研究现状	第11页
1.3 本文的主要研究内容和结构安排	第11-14页
1.3.1 本文的主要研究内容	第11-12页
1.3.2 本文结构安排	第12-14页
第2章理论基础	第14-26页
2.1 聚类分析	第14-17页
2.1.1 聚类的概念和相关定义	第14页
2.1.2 聚类的相似性度量和准则函数	第14-15页
2.1.3 聚类性能评价准则	第15-16页
2.1.4 Kmeans算法	第16-17页
2.2 半监督聚类分析	第17-21页
2.2.1 监督信息的形式	第18页
2.2.2 Seeded-Kmeans算法	第18-19页
2.2.3 COP-Kmeans算法	第19-21页
2.3 主动学习	第21-22页
2.3.1 主动学习基本原理	第21页
2.3.2 主动学习算法过程	第21-22页
2.4 Spark计算框架	第22-25页
2.4.1 Spark体系架构	第22-23页
2.4.2 RDD	第23-24页
2.4.3 Spark运行模式	第24页
2.4.4 Spark的容错机制	第24-25页
2.5 本章小结	第25-26页
第3章基于Seeds集和成对约束的主动半监督聚类算法	第26-36页
3.1 算法总体框架	第26-27页
3.2 算法描述	第27-35页
3.2.1 运用Seeds集扩充成对约束	第27-29页
3.2.2 SC-Kmeans算法	第29-32页
3.2.3 主动学习算法	第32-35页
3.3 本章小结	第35-36页
第4章基于Spark的并行半监督聚类算法	第36-40页
4.1 Spark SC-Kmeans算法描述	第36-37页
4.2 Spark SC-Kmeans算法设计	第37-39页
4.2.1 Map函数的设计	第38页
4.2.2 Reduce函数的设计	第38-39页
4.3 本章小结	第39-40页
第5章实验结果与分析	第40-54页
5.1 主动半监督聚类算法实验分析	第40-49页
5.1.1 实验内容	第40-41页
5.1.2 SC-Kmeans算法实验分析	第41-45页
5.1.3 主动学习算法实验分析	第45-49页
5.2 基于Spark的并行半监督聚类算法实验分析	第49-53页
5.2.1 实验内容	第49页
5.2.2 实验平台和环境	第49-50页
5.2.3 Spark SC-Kmeans算法实验分析	第50-53页
5.3 本章小结	第53-54页
第6章结论与展望	第54-56页
6.1 结论	第54-55页
6.2 展望	第55-56页
致谢	第56-57页
参考文献	第57-60页
作者简介	第60页
攻读硕士学位期间研究成果	第60页