基于Hadoop平台的K-Medoids聚类算法的研究与优化

摘要	第5-6页
ABSTRACT	第6-7页
缩略语对照表	第10-14页
第一章绪论	第14-18页
1.1 研究背景和意义	第14-15页
1.2 国内外研究现状	第15-16页
1.3 本文研究内容	第16页
1.4 本文组织结构	第16-18页
第二章 Hadoop相关技术	第18-28页
2.1 云计算概述	第18-19页
2.1.1 云计算的定义	第18页
2.1.2 云计算的优点	第18-19页
2.2 Hadoop平台	第19-20页
2.3 HDFS分布式文件系统	第20-23页
2.3.1 节点的管理	第20-21页
2.3.2 文件的写入	第21-22页
2.3.3 文件的读取	第22页
2.3.4 HDFS的主要特性	第22-23页
2.4 MapReduce计算框架	第23-26页
2.4.1 MapReduce编程模型	第23-24页
2.4.2 MapReduce任务的执行流程	第24-26页
2.5 本章小结	第26-28页
第三章聚类相关技术	第28-36页
3.1 数据挖掘	第28-29页
3.1.1 数据挖掘的概念与发展	第28页
3.1.2 数据挖掘的任务	第28-29页
3.1.3 数据挖掘的过程	第29页
3.2 聚类分析	第29-33页
3.2.1 聚类算法的分类	第30-31页
3.2.2 聚类分析中的数据结构	第31页
3.2.3 聚类分析中的相似度度量方法	第31-33页
3.2.4 聚类分析的流程	第33页
3.3 常用聚类算法	第33-35页
3.3.1 K-Means算法	第33-34页
3.3.2 K-Medoids算法	第34-35页
3.4 本章小结	第35-36页
第四章 Hadoop平台下K-Medoids算法的优化	第36-52页
4.1 K-Medoids算法	第36-42页
4.1.1 K-Medoids算法原理	第36-37页
4.1.2 K-Medoids算法流程	第37-38页
4.1.3 K-Medoids算法的MapReduce并行化设计	第38-42页
4.2 基于Canopy算法的K-Medoids算法的优化	第42-47页
4.2.1 Canopy算法原理	第42-43页
4.2.2 Canopy算法流程	第43-44页
4.2.3 基于MapReduce的Canopy-K-Medoids算法设计	第44-47页
4.3 HCK-Medoids算法	第47-51页
4.3.1 最大最小距离算法介绍	第47-49页
4.3.2 最大最小距离算法的MapReduce化	第49-50页
4.3.3 HCK-Medoids算法的整体描述	第50-51页
4.4 本章小结	第51-52页
第五章实验结果及分析	第52-60页
5.1 实验环境	第52-54页
5.1.1 软硬件环境	第52-53页
5.1.2 部署Hadoop环境	第53-54页
5.2 实验数据的准备	第54页
5.3 实验结果与分析	第54-58页
5.3.1 准确率的分析	第55-56页
5.3.2 加速比的分析	第56-58页
5.3.3 扩展性分析	第58页
5.4 本章小结	第58-60页
第六章 HCK-Medoids算法在客户细分中的应用	第60-64页
6.1 客户细分	第60-61页
6.1.1 客户细分概述	第60页
6.1.2 客户细分的必要性	第60-61页
6.2 HCK-Medoids算法在客户细分中的应用	第61-63页
6.2.1 数据准备	第61页
6.2.2 实验结果分析	第61-63页
6.3 本章小结	第63-64页
第七章总结与展望	第64-66页
参考文献	第66-68页
致谢	第68-70页
作者简介	第70-71页