分支与不规则访存在GPU上的优化方法研究

摘要	第9-10页
ABSTRACT	第10-11页
第一章绪论	第12-26页
1.1 研究背景与意义	第12-16页
1.1.1 并行计算概述	第12-13页
1.1.2 GPU的发展与结构	第13-16页
1.2 CUDA编程模型	第16-20页
1.2.1 CUDA编程架构	第16-18页
1.2.2 CUDA存储架构	第18-19页
1.2.3 CUDA执行模式	第19-20页
1.3 GPGPU-Sim简介	第20-21页
1.4 分支与不规则访存的产生与影响	第21-24页
1.4.1 分支的产生与影响	第21-23页
1.4.2 不规则访存的产生与影响	第23-24页
1.5 本文目标与主要工作	第24-25页
1.5.1 课题目标	第24页
1.5.2 课题主要工作	第24-25页
1.5.3 课题来源	第25页
1.6 本文结构安排	第25-26页
第二章分支与不规则访存优化研究现状	第26-34页
2.1 分支问题研究现状	第26-30页
2.1.1 硬件优化方法	第26-29页
2.1.2 软件优化方法	第29-30页
2.2 不规则访存研究现状	第30-32页
2.3 本章小结	第32-34页
第三章线程交换优化	第34-41页
3.1 线程交换的基本思想	第34-35页
3.2 线程交换范围的影响	第35-38页
3.3 线程交换方法应用	第38-40页
3.3.1 Reduction	第38-40页
3.3.2 Bitonic Sort	第40页
3.4 本章小结	第40-41页
第四章不规则访存优化	第41-49页
4.1 第一类程序	第42-44页
4.2 第二类程序	第44-46页
4.3 第三类程序	第46-48页
4.4 本章小结	第48-49页
第五章性能与功耗评价	第49-61页
5.1 实验环境	第49-50页
5.2 分支优化测试	第50-52页
5.2.1 Reduction	第50-51页
5.2.2 Bitonic Sort	第51-52页
5.3 不规则访存优化测试	第52-56页
5.3.1 第一类程序	第52-53页
5.3.2 第二类程序	第53-54页
5.3.3 第三类程序	第54-55页
5.3.4 共享存储器大小对优化效果的影响	第55-56页
5.4 功耗分析	第56-60页
5.5 本章小结	第60-61页
第六章结束语	第61-63页
6.1 全文总结	第61-62页
6.2 研究展望	第62-63页
致谢	第63-65页
参考文献	第65-70页
作者在学期间取得的学术成果	第70页