首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

分支与不规则访存在GPU上的优化方法研究

摘要第9-10页
ABSTRACT第10-11页
第一章 绪论第12-26页
    1.1 研究背景与意义第12-16页
        1.1.1 并行计算概述第12-13页
        1.1.2 GPU的发展与结构第13-16页
    1.2 CUDA编程模型第16-20页
        1.2.1 CUDA编程架构第16-18页
        1.2.2 CUDA存储架构第18-19页
        1.2.3 CUDA执行模式第19-20页
    1.3 GPGPU-Sim简介第20-21页
    1.4 分支与不规则访存的产生与影响第21-24页
        1.4.1 分支的产生与影响第21-23页
        1.4.2 不规则访存的产生与影响第23-24页
    1.5 本文目标与主要工作第24-25页
        1.5.1 课题目标第24页
        1.5.2 课题主要工作第24-25页
        1.5.3 课题来源第25页
    1.6 本文结构安排第25-26页
第二章 分支与不规则访存优化研究现状第26-34页
    2.1 分支问题研究现状第26-30页
        2.1.1 硬件优化方法第26-29页
        2.1.2 软件优化方法第29-30页
    2.2 不规则访存研究现状第30-32页
    2.3 本章小结第32-34页
第三章 线程交换优化第34-41页
    3.1 线程交换的基本思想第34-35页
    3.2 线程交换范围的影响第35-38页
    3.3 线程交换方法应用第38-40页
        3.3.1 Reduction第38-40页
        3.3.2 Bitonic Sort第40页
    3.4 本章小结第40-41页
第四章 不规则访存优化第41-49页
    4.1 第一类程序第42-44页
    4.2 第二类程序第44-46页
    4.3 第三类程序第46-48页
    4.4 本章小结第48-49页
第五章 性能与功耗评价第49-61页
    5.1 实验环境第49-50页
    5.2 分支优化测试第50-52页
        5.2.1 Reduction第50-51页
        5.2.2 Bitonic Sort第51-52页
    5.3 不规则访存优化测试第52-56页
        5.3.1 第一类程序第52-53页
        5.3.2 第二类程序第53-54页
        5.3.3 第三类程序第54-55页
        5.3.4 共享存储器大小对优化效果的影响第55-56页
    5.4 功耗分析第56-60页
    5.5 本章小结第60-61页
第六章 结束语第61-63页
    6.1 全文总结第61-62页
    6.2 研究展望第62-63页
致谢第63-65页
参考文献第65-70页
作者在学期间取得的学术成果第70页

论文共70页,点击 下载论文
上一篇:基于传感器网络的数据中心监控系统的研究
下一篇:全球数值天气预报谱模式众核并行计算与优化技术研究