首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

基于计算重用的Spark执行规划优化技术的研究与实现

摘要第9-10页
ABSTRACT第10页
第一章 绪论第11-19页
    1.1 研究背景第11-12页
    1.2 国内外研究现状第12-16页
        1.2.1 传统数据库中的计算重用技术第12页
        1.2.2 NoSQL数据库中基于重用的优化技术第12-16页
    1.3 研究目的和意义第16页
    1.4 论文主要工作第16-19页
第二章 相关技术研究现状分析第19-45页
    2.1 Spark概述第19-24页
        2.1.1 Spark生态系统第20-23页
        2.1.2 Spark架构及基本组件第23-24页
    2.2 Spark执行规划第24-35页
        2.2.1 SparkRDD简介第24-26页
        2.2.2 SparkRDD操作算子第26-31页
        2.2.3 Spark应用的执行规划第31-35页
        2.2.4 Spark应用的语义描述第35页
    2.3 Spark重用机制第35-39页
        2.3.1 Spark中基于缓存的重用技术第36-38页
        2.3.2 基于共享变量的重用技术第38-39页
        2.3.3 应用内的Spark重用第39页
    2.4 语义缓存技术第39-42页
        2.4.1 语义缓存存储形式第39-40页
        2.4.2 查询匹配以及查询划分第40-41页
        2.4.3 缓存替换算法第41页
        2.4.4 缓存的一致性维护第41-42页
    2.5 面向MapReduce系统的数据处理优化技术第42-44页
        2.5.1 基于混合架构的MapReduce计算优化技术第42-43页
        2.5.2 基于重用的MapReduce作业流优化技术第43-44页
    2.6 小结第44-45页
第三章 基于计算重用的Spark执行规划优化模型第45-65页
    3.1 基于语义DAG图的计算重用发现技术研究第45-54页
        3.1.1 语义DAG图与二叉树的转换技术第46-48页
        3.1.2 二叉树的深度优先遍历算法第48-50页
        3.1.3 基于深度优先遍历的语义二叉树匹配算法第50-53页
        3.1.4 计算重用的发现算法第53-54页
    3.2 基于计算代价增益率的Spark缓存仓库丰富策略第54-57页
        3.2.1 计算代价增益率计算模型第55-56页
        3.2.2 计算代价增益率的计算第56-57页
    3.3 Spark执行规划优化策略第57-58页
    3.4 实验分析第58-63页
        3.4.1 实验环境第59页
        3.4.2 实验数据集第59-60页
        3.4.3 优化模型效果分析第60-63页
    3.5 小结第63-65页
第四章 Spark重用优化系统的设计与实现第65-73页
    4.1 系统功能设计第65-66页
    4.2 系统架构与技术选型第66-68页
        4.2.1 系统架构第66页
        4.2.2 语义数据存储技术选型第66-67页
        4.2.3 缓存结果存储技术选型第67-68页
    4.3 系统实现第68-72页
        4.3.1 重用子系统实现第68-70页
        4.3.2 缓存管理子系统实现第70-72页
    4.4 小结第72-73页
第五章 总结与展望第73-75页
    5.1 本文工作总结第73-74页
    5.2 研究工作展望第74-75页
致谢第75-77页
参考文献第77-81页
作者在学期间取得的学术成果第81页

论文共81页,点击 下载论文
上一篇:基于MapGIS的矿产资源规划数据库建库辅助软件设计与实现
下一篇:云环境中基于虚拟机自省的虚拟机数字取证技术研究与实现