基于MapReduce的K_means聚类算法研究

摘要	第1-3页
Abstract	第3-7页
第1章绪论	第7-12页
·选题背景	第7-8页
·国内外研究现状	第8-10页
·论文主要工作及创新点	第10-11页
·论文组织架构	第11页
·本章小结	第11-12页
第2章聚类分析技术	第12-20页
·聚类分析概述	第12-16页
·聚类分析的定义	第12-13页
·聚类分析中的数据结构	第13页
·聚类分析中的度量	第13-15页
·聚类效果的评价标准	第15-16页
·聚类算法的划分	第16-18页
·孤立点检测方法	第18页
·并行聚类技术	第18-19页
·本章小结	第19-20页
第3章 Hadoop技术	第20-28页
·Hadoop概述	第20页
·HDFS（分布式文件系统）	第20-24页
·HDFS体系架构	第21-22页
·文件读取	第22-24页
·MapReduce	第24-27页
·MapReduce执行流程	第24-25页
·编程示例	第25-26页
·MapReduce分布式框架设计特点	第26-27页
·本章小结	第27-28页
第4章基于最大距离法改进的K_means聚类算法	第28-36页
·传统K_means算法简介	第28-31页
·K_means算法思想	第28页
·算法定义及描述	第28-30页
·算法优缺点	第30页
·现有的初始中心点的选取	第30-31页
·基于最大距离法改进的K_means算法	第31-35页
·最大距离法	第31-32页
·基于最大距离法改进的初始化中心选择算法	第32-34页
·改进后的K_means算法流程	第34-35页
·本章小结	第35-36页
第5章基于MapReduce并行聚类算法研究	第36-46页
·基于MapReduce的K_means算法并行化	第36-38页
·并行策略	第36-37页
·基于MapReduce的并行K_means算法流程	第37-38页
·基于MapReduce的Distance_K_means算法并行化	第38-45页
·Distance_centers算法并行化	第38-43页
·Distance_K_means聚类过程并行化	第43-45页
·本章小结	第45-46页
第6章实验	第46-54页
·单机环境下串行聚类算法实验	第46-49页
·实验描述	第46页
·实验结果分析	第46-49页
·小型集群下并行聚类算法实验	第49-53页
·实验环境	第49-50页
·实验描述	第50-51页
·实验结果	第51-53页
·本章小结	第53-54页
第7章总结与展望	第54-55页
·总结	第54页
·展望	第54-55页
参考文献	第55-57页
攻读硕士学位期间取得的研究成果	第57-58页
致谢	第58-59页