半监督聚类中成对约束的主动学习算法研究

摘要	第5-6页
Abstract	第6页
第1章绪论	第11-18页
1.1 研究背景和意义	第11-13页
1.2 国内外研究现状	第13-16页
1.2.1 半监督聚类算法研究现状	第13-14页
1.2.2 主动学习算法研究现状	第14-15页
1.2.3 云计算研究现状	第15-16页
1.3 主要研究成果	第16-17页
1.4 论文组织结构	第17-18页
第2章理论基础	第18-24页
2.1 聚类分析	第18-21页
2.1.1 聚类分析概述	第18-19页
2.1.2 聚类方法的分类	第19-21页
2.1.3 聚类分析的主要应用	第21页
2.2 半监督聚类分析	第21-23页
2.2.1 半监督聚类分析概述	第21-22页
2.2.2 监督信息的形式	第22-23页
2.3 小结	第23-24页
第3章改进的主动学习算法	第24-40页
3.1 主动学习方法	第24-30页
3.1.1 主动学习方法概述	第24页
3.1.2 FFQS算法	第24-26页
3.1.3 Min-Max算法	第26-27页
3.1.4 改进的主动学习算法	第27-30页
3.2 仿真实验与分析	第30-38页
3.2.1 数据集	第30-31页
3.2.2 衡量指标	第31页
3.2.3 实验设计	第31-32页
3.2.4 实验结果及分析	第32-38页
3.3 算法分析讨论	第38-39页
3.3.1 时间复杂度分析	第38页
3.3.2 优化改进方向探讨	第38-39页
3.4 小结	第39-40页
第4章基于MapReduce的主动学习算法并行化研究	第40-60页
4.1 分布式计算技术	第40-43页
4.1.1 Hadoop平台简介	第40-41页
4.1.2 MapReduce编程模型	第41-42页
4.1.3 HDFS分布式文件系统	第42-43页
4.2 主动学习算法并行化研究	第43-52页
4.2.1 Select阶段并行化	第44-46页
4.2.2 Explore阶段并行化	第46-49页
4.2.3 Consolidate阶段并行化	第49-52页
4.3 MPCK-means算法并行化研究	第52-57页
4.3.1 MPCK-means算法介绍	第52-54页
4.3.2 MPCK-means算法并行化设计	第54-57页
4.4 仿真实验与分析	第57-59页
4.4.1 数据集	第57页
4.4.2 评价方法	第57页
4.4.3 实验设计	第57-58页
4.4.4 实验结果及分析	第58-59页
4.5 小结	第59-60页
结论	第60-62页
参考文献	第62-67页
致谢	第67-68页
附录A 在读期间撰写的论文	第68-69页
附录B 在读期间参与的项目	第69页