首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

分支密集应用在GPU上的优化方法研究

摘要第9-11页
ABSTRACT第11-12页
第一章 绪论第13-26页
    1.1 研究背景与意义第13-18页
        1.1.1 GPU的结构与发展第13-18页
    1.2 CUDA编程模型第18-24页
        1.2.1 编程桥梁问题第18-19页
        1.2.2 CUDA编程架构第19-20页
        1.2.3 CUDA执行模型第20页
        1.2.4 控制流问题的产生与影响第20-24页
    1.3 本文目标与主要工作第24-25页
        1.3.1 课题目标第24页
        1.3.2 课题主要工作第24-25页
        1.3.3 课题来源第25页
    1.4 本文结构安排第25-26页
第二章 CUDA及控制流优化研究现状第26-34页
    2.1 CUDA的研究现状第26-27页
    2.2 控制流的优化研究现状第27-33页
        2.2.1 硬件优化方法第27-30页
        2.2.2 软件优化方法第30-33页
    2.3 本章小结第33-34页
第三章 线程交换优化第34-51页
    3.1 线程交换的基本思想第34-37页
        3.1.1 CUDA Kernel的抽象表示第34-36页
        3.1.2 线程交换的概念第36-37页
    3.2 线程交换方法第37-39页
        3.2.1 Control Divergence分类第37页
        3.2.2 交换映射表第37-39页
    3.3 映射表的直接构造第39-45页
        3.3.1 DIMA基本框架第39-42页
        3.3.2 DIMA正确性证明第42-45页
    3.4 映射表的预处理构造第45-47页
        3.4.1 PIMA基本框架第45-46页
        3.4.2 交换数据方法第46-47页
    3.5 设计参数优化探究第47-49页
        3.5.1 预处理构造映射表法的参数选择第47-49页
        3.5.2 非TDD的参数选择第49页
    3.6 本章小结第49-51页
第四章 延迟隐藏优化第51-57页
    4.1 延迟隐藏技术概述第51-53页
    4.2 数据交换的延迟隐藏第53-56页
        4.2.1 延迟隐藏流水线的设计第54-56页
    4.3 本章小结第56-57页
第五章 性能评价第57-84页
    5.1 实验环境第57-60页
    5.2 算法性能测试第60-79页
        5.2.1 使用DIMA算法进行优化的程序第60-70页
        5.2.2 使用PIMA算法进行优化的程序第70-79页
    5.3 延迟隐藏性能评价第79-83页
        5.3.1 Bitonic sort的优化第79-80页
        5.3.2 Reduction的优化第80-81页
        5.3.3 Needle-Wunch的优化第81-82页
        5.3.4 Marching cubes的优化第82-83页
        5.3.5 Hotspots的优化第83页
    5.4 本章小结第83-84页
第六章 结束语第84-86页
    6.1 全文总结第84-85页
    6.2 研究展望第85-86页
致谢第86-88页
参考文献第88-92页
作者在学期间取得的学术成果第92页

论文共92页,点击 下载论文
上一篇:分布式拒绝服务攻击高效局部异常检测技术研究
下一篇:加强军队奖励工作针对性有效性问题研究