首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Spark的K-medoids聚类算法的研究

摘要第5-6页
Abstract第6页
1 绪论第9-15页
    1.1 研究背景和意义第9-11页
    1.2 国内外研究现状第11-13页
    1.3 论文的主要研究内容第13-14页
    1.4 论文的组织结构第14-15页
2 相关技术介绍第15-27页
    2.1 数据挖掘第15-16页
        2.1.1 数据挖掘的概念第15-16页
        2.1.2 数据挖掘的过程第16页
    2.2 聚类算法概述第16-20页
        2.2.1 聚类算法概念第16-18页
        2.2.2 样本相似性度量第18-19页
        2.2.3 聚类效果的评价第19页
        2.2.4 传统的聚类算法第19-20页
    2.3 相关的技术第20-26页
        2.3.1 Hadoop简介第20-21页
        2.3.2 Spark简介第21-23页
        2.3.3 弹性分布数据集第23-25页
        2.3.4 并行操作和共享变量第25-26页
    2.4 本章小结第26-27页
3 分布式环境下K-medoids改进算法的并行化设计与实现第27-34页
    3.1 Canopy算法思想详述第27-28页
        3.1.1 算法概述第27-28页
        3.1.2 算法实现步骤第28页
    3.2 K-medoids算法思想详述第28-30页
        3.2.1 算法概述第28-29页
        3.2.2 算法实现的描述第29页
        3.2.3 算法的优缺点第29-30页
    3.3 基于Hadoop的Canopy-Kmdeoids算法的并行化设计与实现第30-32页
    3.4 基于Spark的Canopy-Kmdeoids算法的并行化设计与实现第32-33页
    3.5 本章小结第33-34页
4 实验平台设计与结果分析第34-40页
    4.1 软硬件环境第34页
    4.2 实验平台的搭建第34-35页
    4.3 实验数据准备第35-36页
    4.4 实验过程及结果分析第36-39页
    4.5 本章小结第39-40页
5 总结与展望第40-42页
    5.1 总结第40页
    5.2 展望第40-42页
参考文献第42-46页
攻读硕士学位期间发表学术论文情况第46-47页
致谢第47页

论文共47页,点击 下载论文
上一篇:基于网络爬虫与短文本相似度的网售化妆品监管系统的研究与设计
下一篇:图像分类中深度特征的二阶统计建模方法研究