首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--一般性问题论文--理论、方法论文--算法理论论文

面向大规模交互式分析的MapReduce优化技术研究

摘要第10-12页
ABSTRACT第12-13页
第一章 绪论第14-30页
    1.1 课题研究背景及意义第14-21页
        1.1.1 大数据及其发展第14-16页
        1.1.2 大规模数据并行处理技术第16-19页
        1.1.3 Map Reduce技术的发展第19-21页
        1.1.4 研究意义总结第21页
    1.2 Map Reduce优化技术研究现状分析第21-26页
        1.2.1 Map Reduce作业执行流程第22页
        1.2.2 Map Reduce框架执行流程第22-23页
        1.2.3 Map Reduce优化技术现状分析第23-25页
        1.2.4 研究现状分析与总结第25-26页
    1.3 本文的主要工作及章节组织结构第26-30页
        1.3.1 论文的主要工作第26-27页
        1.3.2 论文的章节组织结构第27-30页
第二章 基于全局索引的Map Reduce作业调度执行优化第30-48页
    2.1 背景知识及问题描述第31-33页
        2.1.1 Map Reduce背景知识第31-33页
        2.1.2 问题定义第33页
        2.1.3 开销函数及优化目标第33页
    2.2 相关研究第33-35页
    2.3 全局索引技术第35-37页
        2.3.1 基于Hadoop的全局数据组织与索引结构第35-36页
        2.3.2 基于Hadoop的全局索引的生成算法第36-37页
    2.4 基于全局索引的范围查询分析优化第37-43页
        2.4.1 条件表达式分析第38页
        2.4.2 可优化性判定第38-39页
        2.4.3 基于全局索引的任务生成算法第39-41页
        2.4.4 算法优化效果分析第41-43页
    2.5 实验验证第43-47页
        2.5.1 数据集及应用描述第44页
        2.5.2 调度开销对比第44-45页
        2.5.3 IO开销对比第45-46页
        2.5.4 作业响应时间对比第46-47页
    2.6 本章小结第47-48页
第三章 关注数据本地性的公平任务调度算法第48-64页
    3.1 相关研究第49-50页
    3.2 问题形式化描述第50-53页
        3.2.1 数据本地性第50-51页
        3.2.2 多用户、多作业共享集群环境下的公平性第51页
        3.2.3 严格公平调度算法及其数据本地性分析第51-53页
        3.2.4 优化目标第53页
    3.3 K%-公平调度第53-58页
        3.3.1 动态任务调度规划第54-56页
        3.3.2 资源释放后任务队列维护第56页
        3.3.3 空闲计算资源遴选任务第56-58页
    3.4 实验验证第58-62页
        3.4.1 集群环境配置第58-59页
        3.4.2 应用负载类型第59页
        3.4.3 实验结果分析第59-62页
    3.5 本章小节第62-64页
第四章 关注数据本地性的任务调度框架第64-80页
    4.1 相关研究第65-66页
    4.2 问题描述第66-67页
        4.2.1 数据本地性定义第66-67页
        4.2.2 第2优化目标函数定义第67页
        4.2.3 最终优化目标函数定义第67页
    4.3 tasks-job调度框架第67-72页
        4.3.1 不同调度框架下调度算法的数据结构对比第68-71页
        4.3.2 不同调度模型下FIFO调度算法的对比第71-72页
    4.4 实验验证第72-78页
        4.4.1 Hadoop集群环境配置第73-74页
        4.4.2 应用场景描述第74页
        4.4.3 实验结果对比分析第74-78页
    4.5 本章小结第78-80页
第五章 关注集群计算效率的作业调度算法第80-100页
    5.1 相关研究第81-82页
    5.2 问题描述第82-86页
        5.2.1 前提假设第83页
        5.2.2 负载模型第83-84页
        5.2.3 集群硬件模型第84页
        5.2.4 调度第84-86页
    5.3 关注集群计算效率的调度算法第86-91页
        5.3.1 算法设计第86-90页
        5.3.2 算法时间复杂度分析讨论第90-91页
    5.4 实验验证第91-99页
        5.4.1 实验设置第91-93页
        5.4.2 模拟生成的应用负载模式第93-94页
        5.4.3 实验结果评估第94-99页
    5.5 本章小结第99-100页
第六章 总结与展望第100-104页
    6.1 主要研究成果第100-102页
    6.2 下一步研究工作第102-104页
致谢第104-106页
参考文献第106-116页
作者在学期间取得的学术成果第116-117页

论文共117页,点击 下载论文
上一篇:源自嗜酸氧化亚铁硫杆菌的硫化物:醌氧化还原酶的特征、结构和机理研究
下一篇:我国居民通货膨胀承受力测度及压力测试研究