| 摘要 | 第1-4页 |
| ABSTRACT | 第4-7页 |
| 第一章 绪论 | 第7-13页 |
| ·研究背景以及意义 | 第7-8页 |
| ·分布式数据挖掘 | 第7页 |
| ·分布式聚类 | 第7-8页 |
| ·国内外研究现状 | 第8-10页 |
| ·现有的分布式聚类算法以及框架的实现 | 第8-10页 |
| ·存在的问题 | 第10页 |
| ·本文研究内容 | 第10-11页 |
| ·本文章节组织 | 第11-13页 |
| 第二章 相关技术综述 | 第13-23页 |
| ·分布式数据挖掘相关概念 | 第13-14页 |
| ·分布式聚类 | 第14-20页 |
| ·分布式聚类相关概念 | 第14-16页 |
| ·Ensemble clustering | 第16页 |
| ·分布式聚类常遇到的问题 | 第16-17页 |
| ·分布式聚类的典型环境 | 第17-18页 |
| ·聚类结果的评价标准 | 第18-20页 |
| ·分布式聚类的性能分析 | 第20页 |
| ·常用的分布式编程环境介绍 | 第20-23页 |
| ·Hadoop | 第20-22页 |
| ·Mahout | 第22-23页 |
| 第三章 基于模型融合的迭代分布式聚类框架 | 第23-26页 |
| ·分布式聚类框架设计要求 | 第23页 |
| ·体系结构设计 | 第23-24页 |
| ·框架优点 | 第24-26页 |
| 第四章 M-K-means 算法设计及复杂度分析 | 第26-31页 |
| ·K-means | 第26-27页 |
| ·M-K-means | 第27-29页 |
| ·M-K-means 复杂度分析 | 第29-31页 |
| 第五章 M-K-means 实验结果分析 | 第31-48页 |
| ·与单一节点和weighed mean 算法对比分析 | 第31-40页 |
| ·数据准备 | 第31-35页 |
| ·与单一节点的K-Means 对比分析 | 第35-39页 |
| ·与采用weighted mean 的分布式聚类对比分析 | 第39-40页 |
| ·M-K-means 在Hadoop 上的实现与性能分析 | 第40-48页 |
| ·MapReduce 实现原理 | 第41-42页 |
| ·Mahout 中的K-means | 第42-43页 |
| ·M-K-means 在Hadoop 上的实现 | 第43-45页 |
| ·M-K-means 与Mahout K-means 结果分析 | 第45-48页 |
| 第六章 总结与展望 | 第48-50页 |
| 参考文献 | 第50-54页 |
| 发表论文和科研情况说明 | 第54-55页 |
| 致谢 | 第55页 |