首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Spark的模糊c均值聚类算法研究

摘要第4-6页
ABSTRACT第6-7页
第1章 绪论第10-17页
    1.1 研究背景第10-11页
    1.2 研究目的第11-13页
    1.3 研究现状第13-15页
    1.4 研究内容及论文结构第15-17页
        1.4.1 主要研究内容第15-16页
        1.4.2 论文组织结构第16-17页
第2章 聚类算法研究第17-26页
    2.1 引言第17页
    2.2 聚类方法综述第17-21页
        2.2.1 划分聚类方法第17-19页
        2.2.2 层次聚类方法第19页
        2.2.3 密度聚类方法第19-20页
        2.2.4 网格聚类方法第20-21页
    2.3 聚类方法可扩展性分析第21-22页
    2.4 基于目标函数的模糊c均值第22-25页
    2.5 本章小结第25-26页
第3章 Hadoop和Spark的分布式架构对比第26-36页
    3.1 引言第26页
    3.2 通用分布式框架Hadoop第26-28页
        3.2.1 分布式文件系统HDFS第26-27页
        3.2.2 分布式计算模型MapReduce第27-28页
    3.3 快速分布式引擎Spark第28-31页
        3.3.1 Spark的RDD抽象第28-29页
        3.3.2 Spark编程模型第29-31页
    3.4 Hadoop和Spark的迭代性能分析第31-35页
        3.4.1 实验验证第32-34页
        3.4.2 理论说明第34-35页
    3.5 本章小结第35-36页
第4章 可扩展的并行模糊c均值算法第36-47页
    4.1 引言第36页
    4.2 k均值初始化的改进算法第36-39页
        4.2.1 k-means++第37-38页
        4.2.2 k-means∥第38-39页
    4.3 可扩展的并行模糊c均值第39-46页
        4.3.1 算法设计第39-44页
        4.3.2 实验分析第44-46页
    4.4 本章小结第46-47页
第5章 可扩展的并行核化模糊c均值算法第47-57页
    5.1 引言第47页
    5.2 基于核化距离的模糊c均值第47-50页
        5.2.1 核函数综述第47-48页
        5.2.2 基于核化距离的聚类第48-50页
    5.3 可扩展的并行核化模糊c均值第50-56页
        5.3.1 算法设计第51-54页
        5.3.2 实验分析第54-56页
    5.4 本章小结第56-57页
结论第57-59页
参考文献第59-64页
致谢第64页

论文共64页,点击 下载论文
上一篇:面向微博文本的情绪分析方法研究
下一篇:JAVA电子商城系统架构与实现