基于Map-Reduce并行聚类算法的研究

摘要	第1-4页
Abstract	第4-8页
第一章绪论	第8-12页
·研究的背景和意义	第8-9页
·研究现状和难点	第9-10页
·本文的研究内容	第10页
·论文的组织结构	第10-11页
·本章小结	第11-12页
第二章聚类算法相关技术	第12-24页
·聚类算法介绍	第12页
·聚类分析的目的	第12-13页
·聚类分析的相关技术	第13-18页
·聚类分析中的数据结构	第13页
·聚类分析中的数据类型	第13-14页
·聚类分析中的距离度量	第14-17页
·聚类分析的流程	第17-18页
·常用的聚类算法	第18-21页
·划分方法	第18页
·层次方法	第18-20页
·基于密度的方法	第20页
·基于网格的方法	第20页
·基于模型的方法	第20-21页
·聚类效果的评价标准	第21-22页
·并行聚类相关技术	第22-23页
·并行计算简介	第22-23页
·本章小结	第23-24页
第三章 MAP-REDUCE 相关技术介绍	第24-38页
·MAP-REDUCE 简介	第24页
·MAP-REDUCE 执行流程	第24-26页
·编程模型	第26-28页
·Map 和 Reduce 操作	第26-27页
·编程模型示例	第27-28页
·分布式计算框架	第28-31页
·容错性	第28-30页
·任务的本地化执行	第30页
·任务调度	第30-31页
·任务备份	第31页
·HDFS 分布式文件系统	第31-33页
·HBASE 分布式数据库	第33-34页
·MAP-REDUCE 与其它系统的比较	第34-37页
·关系型数据库管理系统	第34-35页
·网格计算	第35-36页
·志愿计算	第36-37页
·本章小结	第37-38页
第四章基于 MAP-REDUCE 并行聚类算法的研究	第38-54页
·K-MEANS 算法简介	第38-42页
·k-means 算法的数学思想	第38-39页
·k-means 算法框架	第39-42页
·基于 MAP-REDUCE 的 K-MEANS 并行算法的设计	第42-44页
·算法时间复杂度分析	第44页
·CANOPY 算法的简介	第44-47页
·基于 Canopy Method 的聚类算法	第44页
·聚类精度	第44-45页
·单机生成 canopy 的算法	第45-47页
·基于 MAP-REDUCE 的 CANOPY-K-MEANS 并行算法的设计	第47-53页
·本章小结	第53-54页
第五章实验与分析	第54-60页
·实验环境	第54-55页
·主机设置	第54-55页
·Hadoop 节点配置	第55页
·实验结果	第55-59页
·准确率分析	第56-58页
·加速比分析	第58-59页
·扩展性分析	第59页
·本章小结	第59-60页
第六章全文总结与展望	第60-62页
·全文总结	第60页
·未来研究展望	第60-62页
致谢	第62-64页
参考文献	第64-66页