首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

大规模并行处理器上资源与性能优化的调度方法研究

摘要第4-6页
ABSTRACT第6-7页
主要符号表第19-20页
1 绪论第20-32页
    1.1 研究背景与意义第20-21页
    1.2 研究动机第21-22页
    1.3 国内外相关研究进展第22-28页
        1.3.1 硬件层次调度方法第23-24页
        1.3.2 软件层次调度方法第24-26页
        1.3.3 其他相关研究第26-28页
    1.4 主要研究思路与内容第28-31页
        1.4.1 资源分配调度优化研究第29页
        1.4.2 执行次序调度优化研究第29-30页
        1.4.3 并行度调度优化研究第30-31页
    1.5 本文结构第31-32页
2 大规模并行处理器系统模型第32-42页
    2.1 并行计算与大规模并行处理器第32-34页
        2.1.1 并行计算概述第32-33页
        2.1.2 大规模并行处理器与GPGPU第33-34页
    2.2 大规模并行处理器体系结构模型第34-37页
    2.3 大规模并行处理器编程模型第37-39页
    2.4 大规模并行处理器的调度系统模型第39-42页
        2.4.1 资源级调度第39页
        2.4.2 指令级调度第39-40页
        2.4.3 任务级调度第40页
        2.4.4 线程级调度第40-42页
3 资源分配调度优化研究第42-75页
    3.1 资源分配优化概述第42-43页
    3.2 多地址空间数据管理第43-47页
        3.2.1 GPGPU多地址空间内存模型第43-44页
        3.2.2 数据实例及其运行时状态第44-47页
    3.3 多地址空间封装机制第47-54页
        3.3.1 地址空间封装第47-49页
        3.3.2 状态迁移操作第49-50页
        3.3.3 多地址空间封装第50-53页
        3.3.4 性能与内存开销分析第53-54页
    3.4 多地址空间封装实验与分析第54-59页
        3.4.1 实验方法第54-55页
        3.4.2 开发效率与性能分析第55-56页
        3.4.3 数据传输效率分析第56-58页
        3.4.4 资源开销分析第58-59页
    3.5 内存资源访问冲突第59-64页
        3.5.1 GPGPU特有内存第59-60页
        3.5.2 多线程资源访问冲突模型分析第60-62页
        3.5.3 多线程资源访问冲突实验分析第62-64页
    3.6 内存资源池技术第64-68页
        3.6.1 内存资源池设计第64-68页
        3.6.2 性能和内存开销分析第68页
    3.7 内存资源池实验与分析第68-74页
        3.7.1 实验方法第68-70页
        3.7.2 代码可维护性分析第70页
        3.7.3 性能分析第70-72页
        3.7.4 资源负载分析第72-74页
        3.7.5 多GPGPU可用性实验第74页
    3.8 本章小结第74-75页
4 执行次序调度优化研究第75-108页
    4.1 执行次序优化概述第75-76页
    4.2 协同调度及其优化策略第76-85页
        4.2.1 GPGPU与协同调度第76-77页
        4.2.2 系统虚拟化第77页
        4.2.3 虚拟化环境的协同调度第77-79页
        4.2.4 协同调度优化建模分析第79-82页
        4.2.5 细粒度协同调度优化策略第82-85页
    4.3 协同调度优化实验与分析第85-90页
        4.3.1 实验方法第85-86页
        4.3.2 SPLASH2实验分析第86-88页
        4.3.3 NPB实验分析第88页
        4.3.4 GPGPU协同调度分析第88-90页
    4.4 GPGPU负载均衡第90-94页
        4.4.1 CTA调度与负载均衡第90-92页
        4.4.2 CTA负载不均衡分析第92-94页
    4.5 基于信用额度的CTA负载均衡调度优化第94-99页
        4.5.1 CLASO结构设计第94-95页
        4.5.2 信用度发放与消耗策略第95-97页
        4.5.3 案例分析第97-98页
        4.5.4 CLASO硬件开销分析第98-99页
    4.6 CTA负载均衡优化实验与分析第99-106页
        4.6.1 实验方法第99-101页
        4.6.2 负载均衡优化效果分析第101-103页
        4.6.3 多调度策略兼容性分析第103-106页
        4.6.4 参数敏感性分析第106页
    4.7 本章小结第106-108页
5 并行度调度优化研究第108-140页
    5.1 并行度优化概述第108-109页
    5.2 源代码并行粒度调整技术第109-117页
        5.2.1 源代码并行粒度调整第109-111页
        5.2.2 GPGPU并行源代码建模第111-112页
        5.2.3 APR代码转换策略第112-114页
        5.2.4 APR正确性分析第114-115页
        5.2.5 案例分析第115-117页
    5.3 源代码并行粒度调整实验与分析第117-121页
        5.3.1 实验方法第117-118页
        5.3.2 语句类型支持范围分析第118页
        5.3.3 正确性实验分析第118页
        5.3.4 性能与效率分析第118-121页
    5.4 线程级并行与流水线第121-128页
        5.4.1 线程级并行度与性能第121-123页
        5.4.2 调度组切换第123-125页
        5.4.3 流水线执行效率第125-127页
        5.4.4 CTA调度与Warp调度第127-128页
    5.5 动态并行度调度优化策略第128-133页
        5.5.1 触发式并行度调整方法第128-130页
        5.5.2 SAWS调度策略设计第130-132页
        5.5.3 SAWS硬件复杂度分析第132-133页
    5.6 动态并行度优化实验与分析第133-138页
        5.6.1 实验方法第133-135页
        5.6.2 性能分析第135页
        5.6.3 并行度优化准确性分析第135-136页
        5.6.4 流水线执行效率分析第136-137页
        5.6.5 多层次组合调度分析第137-138页
    5.7 本章小结第138-140页
6 结论与展望第140-145页
    6.1 结论第140-143页
    6.2 创新点第143页
    6.3 展望第143-145页
参考文献第145-158页
攻读博士学位期间科研项目及科研成果第158-160页
致谢第160-162页
作者简介第162页

论文共162页,点击 下载论文
上一篇:基于Kriging的云任务调度及工程优化云平台建设
下一篇:鲁棒半监督学习算法及在生物统计中的应用研究