首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Hadoop的K-Medoids聚类算法实现与优化

摘要第1-7页
Abstract第7-10页
第1章 引言第10-14页
   ·研究背景第10页
   ·数据挖掘的研究现状第10-11页
   ·Hadoop的发展现状第11-12页
   ·本文的主要研究内容第12-13页
   ·本文结构第13-14页
第2章 聚类分析概述第14-26页
   ·数据挖掘第14-17页
     ·数据挖掘的概念第14-15页
     ·数据挖掘的过程第15-17页
   ·聚类分析第17-25页
     ·聚类分析的概念第17-18页
     ·样本相似距离第18-20页
     ·聚类分析算法第20-24页
     ·K-Means和K-Medoids的比较和分析第24-25页
   ·本章小结第25-26页
第3章 Hadoop与Mahout第26-39页
   ·云计算概述第26-27页
   ·Hadoop云计算平台第27-35页
     ·HDFS文件系统第27-31页
     ·MapReduce编程模型第31-33页
     ·HBase数据库第33-35页
   ·Mahout分析系统第35-38页
     ·Mahout概述第35-36页
     ·Mahout的运用领域第36页
     ·Mahout的K-Means实现第36-37页
     ·Mahout的MeanShift实现第37-38页
   ·本章小结第38-39页
第4章 HK-Medoids算法与优化第39-53页
   ·K-Medoids算法的并行分析第39-41页
     ·K-Medoids的并行化思路第40页
     ·K-Medoids的MapReduce设计第40-41页
   ·HK-Medoids算法的实现第41-46页
     ·HK-Medoids的设计思路第41-43页
     ·HK-Medoids的自定义I/O类第43-44页
     ·HK-Medoids的实现第44-46页
   ·HK-Medoids算法的优化第46-52页
     ·优化MapReduce调度第47-49页
     ·优化计算样本的数量第49页
     ·优化聚类簇的初始中心点第49-50页
     ·优化样本数据来源第50-52页
   ·本章小结第52-53页
第5章 实验与实验结果分析第53-63页
   ·实验环境与数据准备第53-58页
     ·软硬件环境第53-54页
     ·Hadoop平台搭建第54-57页
     ·HBase平台搭建第57页
     ·实验数据第57-58页
   ·实验设计与结果分析第58-62页
     ·有效性分析第58-59页
     ·优化率分析第59-60页
     ·加速比分析第60-62页
   ·本章小节第62-63页
第6章 总结与展望第63-64页
致谢第64-65页
附录第65-66页
参考文献第66-67页

论文共67页,点击 下载论文
上一篇:高效、安全的树形高分子基因及药物载体的制备与应用
下一篇:Web推荐系统中协同过滤算法的研究和应用