首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Spark平台的聚类算法的研究与实现

摘要第6-7页
abstract第7页
第1章 绪论第10-16页
    1.1 研究背景及意义第10-13页
    1.2 国内外研究现状第13-14页
    1.3 研究工作与论文结构第14-16页
        1.3.1 本文的研究工作第14页
        1.3.2 本文章节安排第14-16页
第2章 相关技术第16-35页
    2.1 Hadoop分布式计算平台第16-22页
        2.1.1 MapReduce并行编程模型详述第16-19页
        2.1.2 HDFS分布式文件系统概述第19-22页
    2.2 Spark分布式计算平台第22-31页
        2.2.1 Spark体系结构第23-25页
        2.2.2 Spark基本设计思想第25-31页
    2.3 相关聚类算法第31-34页
    2.4 本章小结第34-35页
第3章 Msk-means算法第35-48页
    3.1 k-means算法思想和优缺点第35-41页
    3.2 当前学者对k-means算法的改进探究第41-43页
    3.3 Msk-means算法对于收敛速度的改进第43-44页
    3.4 Msk-means算法对于初始点选取的改进第44-46页
    3.5 Msk-means算法的步骤第46-47页
    3.6 本章小结第47-48页
第4章 相关算法在Spark平台上的实现第48-54页
    4.1 MLlib介绍第48-49页
    4.2 k-means聚类算法在Spark平台上的实现第49-52页
    4.3 Msk-means算法在Spark平台上的实现第52-53页
    4.4 本章小结第53-54页
第5章 Spark平台的搭建和实验结果分析第54-62页
    5.1 Spark平台的搭建第54-58页
        5.1.1 硬件环境的配置第54页
        5.1.2 配置环境变量第54-55页
        5.1.3 修改spark配置第55页
        5.1.4 编辑spark-env.sh第55-56页
        5.1.5 编辑slaves第56-58页
    5.2 实验方案设计第58页
    5.3 实验过程和结果分析第58-61页
        5.3.1 k-means算法和Msk-means算法的稳定性第58-60页
        5.3.2 Spark集群下k-means算法和Msk-means算法的可扩展性第60-61页
    5.4 本章小结第61-62页
结论第62-63页
参考文献第63-67页
攻读硕士学位期间发表的论文和获得的科研成果第67-68页
致谢第68-69页

论文共69页,点击 下载论文
上一篇:基于子采样方法的图像盲水印方案及其在农业信息化中的应用
下一篇:合成高分子与水凝胶高精度复合打印技术研究