首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于YARN和哈希技术的大数据K近邻研究

摘要第5-6页
Abstract第6页
第1章 引言第9-14页
    1.1 研究背景及意义第9页
    1.2 国内外研究现状第9-11页
    1.3 研究内容及主要工作第11-12页
    1.4 本文的组织结构第12-14页
第2章 Hadoop云计算平台简介第14-24页
    2.1 分布式文件系统HDFS第14-18页
        2.1.1 HDFS的基本框架第14-17页
        2.1.2 HDFS的工作过程第17-18页
    2.2 并行编程框架MapReduce第18-24页
        2.2.1 MapReduce的基本框架第18-19页
        2.2.2 MapReduce的主要组件与编程接口第19-22页
        2.2.3 MapReduce的作业执行流程第22-24页
第3章 Spark云计算平台简介第24-28页
    3.1 Spark的设计理念与基本架构第24-26页
        3.1.1 Spark的基本设计思想第24-25页
        3.1.2 Spark的基本框架第25-26页
    3.2 Spark的核心抽象弹性分布式数据集RDD第26-28页
        3.2.1 RDD的基本概念以及特性第26-27页
        3.2.2 RDD的计算模型第27-28页
第4章 统一资源管理框架YARN简介第28-33页
    4.1 Hadoop1.0 与Hadoop2.0第28-31页
        4.1.1 Hadoop1.0 的缺陷第28-29页
        4.1.2 Hadoop2.0 的改善第29-31页
    4.2 Yarn框架的体系结构第31-32页
    4.3 基于Yarn平台的作业运行机制第32-33页
第5章 基于YARN和哈希技术的K-近邻分类算法的研究第33-47页
    5.1 基于YARN平台的Hadoop和Spark云计算平台的搭建第33-37页
        5.1.1 Hadoop云计算平台搭建的步骤第33-36页
        5.1.2 Spark云计算平台搭建的步骤第36-37页
    5.2 基于YARN和哈希技术的K-近邻分类算法的实现第37-43页
        5.2.1 SimHash算法的介绍第37-38页
        5.2.2 基于MapReduce和哈希技术的K-近邻分类算法的设计思想第38-40页
        5.2.3 基于Spark和哈希技术的K-近邻分类算法的设计思想第40-43页
    5.3 实验结果与分析第43-47页
第6章 工作总结与展望第47-48页
参考文献第48-51页
致谢第51-52页
攻读学位期间取得的科研成果第52页

论文共52页,点击 下载论文
上一篇:基于改进的Gabor特征提取的唇纹识别
下一篇:基于特征提取的网络测量数据集构建方法研究