GPU Warp调度算法优化研究

摘要	第4-6页
Abstract	第6-7页
第一章绪论	第13-25页
1.1 研究背景	第13-17页
1.1.1 集成电路概述与发展	第13-14页
1.1.2 多核处理器	第14-15页
1.1.3 GPU的发展	第15-17页
1.2 相关技术	第17-23页
1.2.1 GPGPU技术	第17-18页
1.2.2 GPU多线程并行	第18页
1.2.3 CUDA编程模型	第18-22页
1.2.4 GPU Warp调度	第22-23页
1.3 论文的主要内容和论文结构	第23-24页
1.3.1 论文的主要内容	第23-24页
1.3.2 论文结构	第24页
1.4 课题来源	第24-25页
第二章 Warp调度算法	第25-37页
2.1 典型Warp调度算法	第25-28页
2.1.1 轮训调度算法	第25-26页
2.1.2 贪婪调度算法	第26-27页
2.1.3 分区调度算法	第27-28页
2.2 Warp调度算法中的关键问题	第28-31页
2.2.1 片外访存等长延迟操作	第28-29页
2.2.2 分支操作	第29-30页
2.2.3 资源限制	第30-31页
2.2.4 局部性问题	第31页
2.3 Warp调度算法仿真平台	第31-36页
2.3.1 GPGPU-Sim简介	第31-33页
2.3.2 GPGPU-Sim仿真架构	第33-36页
2.4 本章小结	第36-37页
第三章基于贪婪算法的两级调度策略	第37-56页
3.1 两级调度策略	第37-39页
3.1.1 两级调度介绍	第37-38页
3.1.2 两级调度中的分组大小	第38-39页
3.2 贪婪调度算法的选择	第39-42页
3.2.1 几种贪婪调度算法的比较	第39-41页
3.2.2 贪婪调度算法与轮训调度算法的比较	第41-42页
3.3 贪婪算法与两级调度的结合	第42-44页
3.3.1 基于贪婪算法的两级调度策略	第42-43页
3.3.2 与基于轮训算法的两级调度策略对比	第43-44页
3.4 调度算法性能比较	第44-47页
3.5 调度算法实现	第47-55页
3.5.1 GPU架构实现	第47-50页
3.5.2 计算核心流水线结构	第50-52页
3.5.3 基于贪婪算法的两级调度策略实现	第52-55页
3.6 本章小结	第55-56页
第四章仿真验证与性能分析	第56-69页
4.1 仿真验证平台	第56-59页
4.1.1 仿真验证平台仿真精度	第56-57页
4.1.2 CUDA程序在仿真器上的执行	第57-58页
4.1.3 仿真数据输出	第58-59页
4.2 基准测试程序	第59-62页
4.2.1 基准测试程序介绍	第59-60页
4.2.2 基准测试程序指令分类	第60-62页
4.2.3 Warp线程使用率	第62页
4.3 Warp调度算法性能分析	第62-68页
4.3.1 整体性能分析	第62-66页
4.3.2 Warp调度算法对缓存命中率影响	第66-68页
4.4 本章小结	第68-69页
第五章总结和展望	第69-71页
5.1 总结	第69页
5.2 未来工作展望	第69-71页
参考文献	第71-75页
攻读学位期间的项目和成果	第75-76页
致谢	第76-78页