首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

云计算环境下海量数据的并行聚类算法研究

创新点摘要第5-6页
摘要第6-8页
ABSTRACT第8-9页
第1章 绪论第12-30页
    1.1 课题背景及研究意义第12-15页
    1.2 聚类理论第15-22页
        1.2.1 聚类的定义及过程第15-16页
        1.2.2 相似性度量第16-18页
        1.2.3 常用的聚类算法第18-20页
        1.2.4 聚类结果检验第20-22页
    1.3 国内外研究现状第22-28页
    1.4 主要研究内容第28-30页
第2章 云计算环境下海量数据聚类的相关技术第30-49页
    2.1 云计算第30-34页
        2.1.1 云计算概述第30-33页
        2.1.2 云计算关键技术第33-34页
    2.2 MapReduce介绍第34-39页
        2.2.1 MapReduce编程模型及运行原理第35-37页
        2.2.2 Hadoop MapReduce实现第37-39页
    2.3 k-means聚类算法第39-46页
        2.3.1 k-means算法概述第39-42页
        2.3.2 k-means算法存在的问题第42页
        2.3.3 k-means的MapReduce实现第42-46页
    2.4 k-means++和scalable k-means++第46-48页
    2.5 本章小结第48-49页
第3章 并行可扩展的k-means++聚类算法第49-66页
    3.1 引言第49-50页
    3.2 并行可扩展的k-means++聚类算法第50-58页
        3.2.1 PSKMI算法实现第50-52页
        3.2.2 PSKM++理论分析第52-56页
        3.2.3 PSKMI算法的优化第56-58页
    3.3 实验及结果分析第58-65页
        3.3.1 实验环境设置第59-60页
        3.3.2 实验结果及分析第60-65页
    3.4 本章小节第65-66页
第4章 快速的scalable k-means++聚类算法第66-80页
    4.1 引言第66-67页
    4.2 快速的scalable k-means++聚类算法第67-74页
        4.2.1 MRSKMI实现第68-69页
        4.2.2 过采样修正方法第69-72页
        4.2.3 优化策略第72-74页
    4.3 实验及结果分析第74-78页
        4.3.1 实验环境设置第74页
        4.3.2 实验结果及分析第74-78页
    4.4 本章小结第78-80页
第5章 基于抽样估计的数据划分方法第80-104页
    5.1 引言第80-81页
    5.2 同步Map和Reduce第81-83页
    5.3 解决方法概述第83-84页
    5.4 抽样第84-88页
    5.5 数据划分方法第88-93页
        5.5.1 簇组合第88-90页
        5.5.2 簇分割组合第90-93页
    5.6 应用第93-94页
    5.7 实验及结果分析第94-103页
        5.7.1 实验环境设置第94-96页
        5.7.2 实验结果及分析第96-103页
    5.8 本章小结第103-104页
第6章 总结与展望第104-106页
    6.1 工作总结第104-105页
    6.2 研究展望第105-106页
参考文献第106-121页
攻读学位期间公开发表论文第121-122页
致谢第122-123页
作者简介第123页

论文共123页,点击 下载论文
上一篇:角蛋白水解液柱下液制备复合氨基酸钙的的研究
下一篇:狂欢理论视域下的网络表情包研究