首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

面向交互式Spark应用的RDD数据动态放置技术研究

摘要第4-5页
Abstract第5-6页
第1章 绪论第10-16页
    1.1 课题背景和研究意义第10-12页
        1.1.1 大数据处理平台的发展第10页
        1.1.2 Spark海量数据处理平台第10-12页
        1.1.3 交互式Spark应用下RDD数据动态放置的意义第12页
    1.2 国内外研究现状第12-14页
    1.3 本文的主要贡献第14-15页
    1.4 本文的组织结构第15页
    1.5 本章小结第15-16页
第2章 相关工作第16-26页
    2.1 Spark平台概述第16-19页
        2.1.1 Spark平台架构第16-17页
        2.1.2 Spark平台计算模型和运行时环境第17-18页
        2.1.3 Spark平台缓存机制第18页
        2.1.4 Spark动态资源分配方式第18-19页
    2.2 分布式内存计算平台上的数据管理概述第19-21页
        2.2.1 Spark平台上的数据管理第19-20页
        2.2.2 其它分布式内存计算平台上的数据管理第20-21页
    2.3 大数据平台下数据放置策略概述第21-24页
        2.3.1 针对负载均衡的数据放置策略第21-22页
        2.3.2 针对数据相关性的数据放置策略第22-23页
        2.3.3 针对其他因素的数据放置策略第23-24页
    2.4 本章小结第24-26页
第3章 缓存RDD数据动态放置策略第26-36页
    3.1 问题描述第26-27页
    3.2 缓存RDD分区的价值与放置收益评估第27-31页
        3.2.1 问题定义第27-28页
        3.2.2 缓存RDD分区的价值第28-30页
        3.2.3 缓存RDD分区的放置收益评估第30-31页
    3.3 数据放置策略第31-35页
        3.3.1 数学模型的定义第31页
        3.3.2 粒子群算法简介第31-32页
        3.3.3 基于粒子群的缓存RDD分区动态放置建模第32-34页
        3.3.4 缓存RDD分区的动态放置策略第34-35页
    3.4 本章小结第35-36页
第4章 基于马尔可夫模型的非活跃期预测算法第36-44页
    4.1 问题描述第36页
    4.2 马尔可夫模型第36-38页
        4.2.1 马尔可夫过程第36-37页
        4.2.2 马尔可夫链第37页
        4.2.3 一步转移概率第37-38页
        4.2.4 状态转移矩阵第38页
    4.3 非活跃期预测的马尔可夫适用性分析第38页
    4.4 交互式Spark应用非活跃期预测算法第38-40页
    4.5 基于预测的数据放置触发策略第40-42页
    4.6 本章小结第42-44页
第5章 原型系统实现第44-52页
    5.1 改造后的Spark系统架构第44-45页
    5.2 缓存RDD数据动态放置策略的实现第45-49页
        5.2.1 参数收集功能的实现第45-48页
        5.2.2 数据动态放置功能的实现第48-49页
    5.3 基于马尔可夫模型的非活跃期预测算法的实现第49-50页
        5.3.1 交互式Spark应用处于非活跃期的持续时间收集功能的实现第49-50页
        5.3.2 基于马尔可夫模型的预测功能的实现第50页
    5.4 本章小结第50-52页
第6章 性能测试与分析第52-68页
    6.1 测试环境第52页
    6.2 测试负载的选取及实验方法第52-54页
    6.3 性能评价指标第54页
    6.4 性能测试结果及分析第54-67页
        6.4.1 单请求性能测试结果与分析第54-61页
        6.4.2 综合性能测试的测试结果与分析第61-67页
    6.5 本章小结第67-68页
结论第68-70页
参考文献第70-74页
攻读硕士学位期间所发表的学术成果第74-76页
致谢第76页

论文共76页,点击 下载论文
上一篇:云环境中虚拟可信根管理框架关键技术研究
下一篇:基于PCI-E总线的多板卡高速互连技术研究