首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于MapReduce的随机抽样K-Means算法的研究

致谢第4-5页
摘要第5-6页
Abstract第6页
1 绪论第9-14页
    1.1 课题的研究背景第9页
    1.2 国内外研究现状第9-12页
    1.3 课题的研究内容第12-13页
    1.4 论文结构第13-14页
2 本文相关理论知识介绍第14-33页
    2.1 聚类算法第14-16页
        2.1.1 聚类的概念第14页
        2.1.2 聚类分析的分类第14-15页
        2.1.3 K-Means算法简介第15-16页
    2.2 Hadoop相关理论第16-25页
        2.2.1 HDFS文件系统第16-21页
        2.2.2 MapReduce编程模型第21-25页
    2.3 蓄水池算法和聚类分析中的抽样算法介绍第25-32页
        2.3.1 蓄水池算法第25-27页
        2.3.2 聚类分析中的抽样算法第27-32页
    2.4 本章小结第32-33页
3 基于MapReduce改进的K-Means算法第33-48页
    3.1 传统K-Means算法的不足第33-34页
    3.2 基于MapReduce的K-Means算法第34-38页
    3.3 针对K-Means算法的改进方案第38-40页
    3.4 改进的K-Means算法设计方案第40-47页
        3.4.1 基于蓄水池算法的随机采样第40-42页
        3.4.2 算法描述第42-47页
    3.5 本章小结第47-48页
4 基于MapReduce的随机抽样K-Means算法的实验结果与分析第48-56页
    4.1 实验环境第48-49页
    4.2 单机实验结果及分析第49-52页
        4.2.1 单机数据负载实验第49-50页
        4.2.2 聚类效果测试第50-52页
    4.3 集群测试第52-55页
        4.3.1 海量数据聚类效果测试第52-53页
        4.3.2 运行效率对比实验第53-54页
        4.3.3 加速比及扩展性分析第54-55页
    4.4 本章小结第55-56页
结论第56-58页
参考文献第58-62页
作者简历第62-64页
学位论文数据集第64页

论文共64页,点击 下载论文
上一篇:因素轮廓相似性分析方法与应用研究
下一篇:基于改进蚁群算法的医学CT图像边缘检测