基于Hadoop的K-Medoids聚类算法实现与优化

摘要	第1-7页
Abstract	第7-10页
第1章引言	第10-14页
·研究背景	第10页
·数据挖掘的研究现状	第10-11页
·Hadoop的发展现状	第11-12页
·本文的主要研究内容	第12-13页
·本文结构	第13-14页
第2章聚类分析概述	第14-26页
·数据挖掘	第14-17页
·数据挖掘的概念	第14-15页
·数据挖掘的过程	第15-17页
·聚类分析	第17-25页
·聚类分析的概念	第17-18页
·样本相似距离	第18-20页
·聚类分析算法	第20-24页
·K-Means和K-Medoids的比较和分析	第24-25页
·本章小结	第25-26页
第3章 Hadoop与Mahout	第26-39页
·云计算概述	第26-27页
·Hadoop云计算平台	第27-35页
·HDFS文件系统	第27-31页
·MapReduce编程模型	第31-33页
·HBase数据库	第33-35页
·Mahout分析系统	第35-38页
·Mahout概述	第35-36页
·Mahout的运用领域	第36页
·Mahout的K-Means实现	第36-37页
·Mahout的MeanShift实现	第37-38页
·本章小结	第38-39页
第4章 HK-Medoids算法与优化	第39-53页
·K-Medoids算法的并行分析	第39-41页
·K-Medoids的并行化思路	第40页
·K-Medoids的MapReduce设计	第40-41页
·HK-Medoids算法的实现	第41-46页
·HK-Medoids的设计思路	第41-43页
·HK-Medoids的自定义I/O类	第43-44页
·HK-Medoids的实现	第44-46页
·HK-Medoids算法的优化	第46-52页
·优化MapReduce调度	第47-49页
·优化计算样本的数量	第49页
·优化聚类簇的初始中心点	第49-50页
·优化样本数据来源	第50-52页
·本章小结	第52-53页
第5章实验与实验结果分析	第53-63页
·实验环境与数据准备	第53-58页
·软硬件环境	第53-54页
·Hadoop平台搭建	第54-57页
·HBase平台搭建	第57页
·实验数据	第57-58页
·实验设计与结果分析	第58-62页
·有效性分析	第58-59页
·优化率分析	第59-60页
·加速比分析	第60-62页
·本章小节	第62-63页
第6章总结与展望	第63-64页
致谢	第64-65页
附录	第65-66页
参考文献	第66-67页