首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Spark平台的大数据聚类算法研究及其应用

摘要第4-5页
Abstract第5-6页
第一章 绪论第9-14页
    1.1 研究背景与课题来源第9-11页
    1.2 国内外相关研究第11-12页
    1.3 论文主要研究内容第12页
    1.4 论文组织结构第12-14页
第二章 相关技术基本理论介绍第14-21页
    2.1 Spark分布式平台第14-16页
        2.1.1 Spark简介第14-15页
        2.1.2 Spark体系架构第15-16页
    2.2 HDFS存储和YARN资源管理器第16-18页
        2.2.1 HDFS存储第16-17页
        2.2.2 YARN资源管理器第17-18页
    2.3 聚类算法第18-20页
        2.3.1 划分聚类算法第18-19页
        2.3.2 层次聚类算法第19页
        2.3.3 密度聚类算法第19-20页
        2.3.4 网格聚类算法第20页
    2.4 本章小结第20-21页
第三章 聚类算法的研究与优化第21-35页
    3.1 聚类算法中的距离第21-22页
        3.1.1 欧式距离第21页
        3.1.2 切比雪夫距离第21-22页
    3.2 聚类算法第22-29页
        3.2.1 K-means聚类算法第22-25页
        3.2.2 BIRCH聚类算法第25-29页
    3.3 聚类算法的优化第29-32页
        3.3.1 数据汇聚预处理第29-31页
        3.3.2 数据排序处理第31-32页
        3.3.3 优化算法介绍第32页
    3.4 聚类算法性能对比第32-34页
    3.5 本章小结第34-35页
第四章 聚类算法并行化研究第35-47页
    4.1 并行计算与集群环境第35-36页
        4.1.1 并行计算概要第35页
        4.1.2 并行编程模型第35-36页
    4.2 算法的并行化实现第36-42页
        4.2.1 数据预处理并行化第37-38页
        4.2.2 K-means 算法并行化第38-40页
        4.2.3 BIRCH算法并行化第40-42页
    4.3 算法并行化的性能分析第42-46页
        4.3.1 并行算法的性能评价第42-43页
        4.3.2 并行算法的性能对比第43-46页
    4.4 本章小结第46-47页
第五章 基于Spark平台大数据聚类应用第47-58页
    5.1 实验环境搭建第47-52页
        5.1.1 Linux 系统网络配置第47-48页
        5.1.2 Hadoop 集群搭建第48-51页
        5.1.3 Spark 集群搭建第51-52页
        5.1.4 GcoMcsa安装部署第52页
    5.2 实验数据分析第52-54页
        5.2.1 数据结构分析与抽取第52-53页
        5.2.2 数据分析方案第53-54页
    5.3 实验结果展示第54-57页
        5.3.1 GPS数据密度展示第54-56页
        5.3.2 未来数据预测第56-57页
    5.4 本章小结第57-58页
第六章 总结与展望第58-60页
参考文献第60-62页
附录1 攻读硕士学位期间申请的专利第62-63页
附录2 攻读硕士学位期间参见的科研项目第63-64页
致谢第64页

论文共64页,点击 下载论文
上一篇:面向智能终端的触觉再现系统和建模方法研究
下一篇:改进组合优化决策树算法在谣言判别的研究应用