基于模型融合的迭代式分布式聚类框架的设计与实现

摘要	第1-4页
ABSTRACT	第4-7页
第一章绪论	第7-13页
·研究背景以及意义	第7-8页
·分布式数据挖掘	第7页
·分布式聚类	第7-8页
·国内外研究现状	第8-10页
·现有的分布式聚类算法以及框架的实现	第8-10页
·存在的问题	第10页
·本文研究内容	第10-11页
·本文章节组织	第11-13页
第二章相关技术综述	第13-23页
·分布式数据挖掘相关概念	第13-14页
·分布式聚类	第14-20页
·分布式聚类相关概念	第14-16页
·Ensemble clustering	第16页
·分布式聚类常遇到的问题	第16-17页
·分布式聚类的典型环境	第17-18页
·聚类结果的评价标准	第18-20页
·分布式聚类的性能分析	第20页
·常用的分布式编程环境介绍	第20-23页
·Hadoop	第20-22页
·Mahout	第22-23页
第三章基于模型融合的迭代分布式聚类框架	第23-26页
·分布式聚类框架设计要求	第23页
·体系结构设计	第23-24页
·框架优点	第24-26页
第四章 M-K-means 算法设计及复杂度分析	第26-31页
·K-means	第26-27页
·M-K-means	第27-29页
·M-K-means 复杂度分析	第29-31页
第五章 M-K-means 实验结果分析	第31-48页
·与单一节点和weighed mean 算法对比分析	第31-40页
·数据准备	第31-35页
·与单一节点的K-Means 对比分析	第35-39页
·与采用weighted mean 的分布式聚类对比分析	第39-40页
·M-K-means 在Hadoop 上的实现与性能分析	第40-48页
·MapReduce 实现原理	第41-42页
·Mahout 中的K-means	第42-43页
·M-K-means 在Hadoop 上的实现	第43-45页
·M-K-means 与Mahout K-means 结果分析	第45-48页
第六章总结与展望	第48-50页
参考文献	第50-54页
发表论文和科研情况说明	第54-55页
致谢	第55页