首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Spark的谱聚类算法及其在QAR数据中的应用

摘要第5-6页
Abstract第6页
第一章 绪论第9-14页
    1.1 研究背景及意义第9-10页
    1.2 国内外研究现状第10-12页
    1.3 本文主要内容第12页
    1.4 论文组织第12-14页
第二章 相关技术分析第14-26页
    2.1 Hadoop第14-16页
        2.1.1 HDFS第15-16页
        2.1.2 MapReduce第16页
    2.2 Spark第16-23页
        2.2.1 分布式弹性数据集RDD第17-21页
        2.2.2 Spark运行框架概述第21-22页
        2.2.3 GraphX第22-23页
    2.3 Hive数据仓库第23-25页
    2.4 本章小结第25-26页
第三章 基于Spark的谱聚类算法第26-40页
    3.1 谱聚类算法原理分析第26-31页
        3.1.1 相似性图第26-27页
        3.1.2 拉普拉斯矩阵及其基本性质第27-28页
        3.1.3 图划分准则第28-30页
        3.1.4 谱聚类算法步骤第30-31页
    3.2 并行化谱聚类算法第31-35页
        3.2.1 GraphX构建相似性图第31-32页
        3.2.2 计算拉普拉斯矩阵第32-33页
        3.2.3 并行Lanczos算法计算特征向量第33-34页
        3.2.4 并行化K-means对特征向量矩阵进行聚类第34-35页
    3.3 实验与分析第35-39页
        3.3.1 实验环境第35-36页
        3.3.2 实验数据第36-37页
        3.3.3 算法性能实验第37-39页
    3.4 本章小结第39-40页
第四章 QAR数据存储及聚类第40-50页
    4.1 QAR数据仓库在Hive中的构建第40-45页
        4.1.1 QAR文件存储第40-43页
        4.1.2 数据仓库存储结构第43-44页
        4.1.3 QAR数据仓库总体架构第44-45页
    4.2 并行化谱聚类在QAR数据中的应用第45-49页
        4.2.1 QAR数据预处理第46-47页
        4.2.2 并行谱聚类在QAR数据中的应用第47-49页
    4.3 本章小结第49-50页
第五章 总结与展望第50-52页
    5.1 本文主要工作及特色第50页
    5.2 下一步研究方向第50-52页
致谢第52-53页
参考文献第53-57页
作者简介第57页

论文共57页,点击 下载论文
上一篇:供热直埋管道等效温差循环次数的研究
下一篇:行政许可法视野下我国航班时刻分配制度研究