首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于MapReduce的海量数据K-means聚类算法研究

摘要第4-5页
Abstract第5页
引言第8-10页
1 论文研究背景第10-14页
    1.1 课题研究背景和意义第10-11页
    1.2 国内外研究现状和分析第11-12页
    1.3 论文主要工作及创新点第12页
    1.4 论文组织框架第12-14页
2 相关技术概述第14-26页
    2.1 MapReduce第14-16页
    2.2 Hadoop第16-17页
    2.3 聚类分析第17-23页
        2.3.1 聚类概述第18-19页
        2.3.2 聚类中的度量第19-21页
        2.3.3 聚类的主要分类第21-23页
    2.4 基于划分的典型聚类第23-25页
        2.4.1 K-means算法第23-24页
        2.4.2 Kmeans++算法第24页
        2.4.3 Kmeans||算法第24-25页
    2.5 本章小结第25-26页
3 基于MapReduce的快速K-means聚类第26-37页
    3.1 性能瓶颈分析第26-27页
    3.2 抽样第27-31页
        3.2.1 系统抽样第28-29页
        3.2.2 迭代抽样第29-31页
    3.3 快速K-means聚类处理模型第31-36页
        3.3.1 基于权重的合并策略第34页
        3.3.2 基于分布的合并策略第34-35页
        3.3.3 数据划分第35-36页
    3.4 本章小结第36-37页
4 实验部分第37-47页
    4.1 实验环境第37-39页
        4.1.1 数据集介绍第37-38页
        4.1.2 集群配置介绍第38-39页
        4.1.3 基准算法与实验第39页
    4.2 实验结果对比第39-43页
        4.2.1 执行效率对比第40-41页
        4.2.2 可扩展性对比第41-43页
    4.3 聚类效果评价第43-46页
        4.3.1 聚类评估第43-44页
        4.3.2 偏离孤立点处理效果第44-46页
    4.4 本章小结第46-47页
结论第47-48页
参考文献第48-51页
攻读硕士学位期间发表学术论文情况第51-52页
致谢第52-53页

论文共53页,点击 下载论文
上一篇:音译外国人名自动识别的研究
下一篇:大连某地区单桩静载荷现场及数值试验研究