首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

大数据背景下的聚类算法研究

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第10-16页
    1.1 研究背景第10-11页
    1.2 国内外研究现状第11-13页
    1.3 研究的意义第13-14页
    1.4 论文研究的主要内容及结构安排第14-16页
第二章 相关理论研究第16-31页
    2.1 聚类算法第16-19页
        2.1.1 聚类的定义第16页
        2.1.2 聚类算法的分类第16-19页
    2.2 大数据简介第19-21页
        2.2.1 大数据的定义第19页
        2.2.2 大数据的特点与发展第19-21页
    2.3 Hadoop开源云计算平台第21-30页
        2.3.1 Hadoop的简介第21-22页
        2.3.2 Hadoop的结构第22页
        2.3.3 HDFS分布式文件系统第22-24页
        2.3.4 MapReduce分布式计算框架第24-30页
    2.4 本章小结第30-31页
第三章 基于Hash改进的K-means算法并行化设计第31-40页
    3.1 K-means算法并行化分析第31-32页
    3.2 Hash算法简介第32页
    3.3 基于Hash算法的初始聚类中心选取第32-34页
    3.4 基于Hash改进的K-means算法第34-35页
        3.4.1 算法流程第34页
        3.4.2 算法伪代码实现第34-35页
    3.5 改进算法在MapReduce框架上的实现第35-37页
        3.5.1 算法并行化实现策略第35页
        3.5.2 算法并行化的具体实现第35-37页
    3.6 实验第37-39页
        3.6.1 实验数据和环境第37-38页
        3.6.2 实验结果及分析第38-39页
    3.7 本章小结第39-40页
第四章 一种Hadoop平台下的树形聚类算法第40-48页
    4.1 基于权重的数据分块第40-41页
    4.2 微团定义第41页
    4.3 树形合并第41-42页
    4.4 PAClustering算法第42-43页
        4.4.1 PAClustering算法思想第42-43页
        4.4.2 PAClustering算法描述第43页
    4.5 PAClustering算法在Hadoop平台的实现第43-45页
    4.6 实验第45-47页
        4.6.1 实验数据和环境第45页
        4.6.2 实验结果及分析第45-47页
    4.7 本章小结第47-48页
第五章 总结与展望第48-49页
参考文献第49-53页
致谢第53-54页
附录A (攻读学位期间所发表的学术论文)第54-55页
中文详细摘要第55-59页
英文详细摘要第59-63页

论文共63页,点击 下载论文
上一篇:基于群智能算法的聚类挖掘方法研究
下一篇:基于Web平台的数据库安全研究及应用