针对不规则应用的图形处理器资源调度关键技术研究

摘要	第3-4页
Abstract	第4-5页
目录	第6-9页
主要符号对照表	第9-10页
第1章引论	第10-25页
1.1 论文背景	第10-12页
1.2 图形处理器的发展变迁	第12-16页
1.3 图形处理器的硬件架构和编程模型	第16-19页
1.3.1 硬件架构	第16-18页
1.3.2 编程模型	第18-19页
1.4 不规则应用的特征和挑战	第19-23页
1.4.1 不规则计算	第19-21页
1.4.2 不规则访存	第21-23页
1.5 本文的内容及组织	第23-25页
第2章相关工作	第25-31页
2.1 优化技术	第25-29页
2.1.1 基于线程束的调度	第25-27页
2.1.2 基于存储空间的管理	第27-28页
2.1.3 基于任务的调度	第28-29页
2.2 仿真器平台	第29-31页
第3章针对不规则模式的算法优化	第31-63页
3.1 本章引论	第31-32页
3.2 SMVP 算法优化和性能评估	第32-45页
3.2.1 SMVP 介绍	第32-34页
3.2.2 算法优化	第34-38页
3.2.3 SMVP 性能评估	第38-41页
3.2.4 静态时序分析性能评估	第41-42页
3.2.5 共轭梯度算法性能评估	第42-43页
3.2.6 BFS 的实现和性能评估	第43-45页
3.3 字符串匹配算法优化和性能评估	第45-53页
3.3.1 字符串匹配算法介绍	第45-48页
3.3.2 算法优化	第48-51页
3.3.3 性能评估	第51-53页
3.4 QR 分解算法优化和性能评估	第53-61页
3.4.1 QR 分解算法介绍	第53-56页
3.4.2 算法优化	第56-59页
3.4.3 性能评估	第59-61页
3.5 本章小结	第61-63页
第4章针对不规则访存的存储资源调度技术	第63-83页
4.1 本章引论	第63-65页
4.2 GPU 程序统性能的量化分析	第65-71页
4.2.1 末级缓存性能与系统性能关系	第66-68页
4.2.2 访存请求地址分布	第68-70页
4.2.3 访存分支分布	第70-71页
4.3 基于有效地址优先级的缓存管理策略	第71-74页
4.3.1 优先级的赋值和比较	第71-73页
4.3.2 优先级的周期性更新	第73-74页
4.4 基于分支特性的内存调度策略	第74-76页
4.5 硬件开销评估	第76页
4.6 实验结果与讨论	第76-81页
4.6.1 有效地址优先级对于性能的影响	第77-78页
4.6.2 缓存管理策略中的动态更新机制	第78-79页
4.6.3 缓存管理策略对于缓存和系统性能的影响	第79-80页
4.6.4 内存调度策略对于性能的影响	第80-81页
4.7 本章小结	第81-83页
第5章面向流计算的资源动态分配技术	第83-105页
5.1 本章引论	第83-86页
5.2 针对流计算的性能量化分析	第86-92页
5.2.1 仿真环境和测试程序	第86-88页
5.2.2 程序性能与流多处理器数量的关系	第88-90页
5.2.3 多任务并发执行对于性能的影响	第90-92页
5.3 支持双任务并发执行的动态调度机制	第92-99页
5.3.1 计算资源分配	第92-95页
5.3.2 缓存资源分配	第95-97页
5.3.3 硬件开销评估	第97-99页
5.4 实验结果与讨论	第99-103页
5.4.1 性能总体评估	第99-101页
5.4.2 性能分解	第101-102页
5.4.3 内存访问次数	第102页
5.4.4 多任务并发执行	第102-103页
5.5 本章小结	第103-105页
第6章总结与展望	第105-108页
6.1 全文工作总结	第105-106页
6.2 本文局限性和未来研究展望	第106-108页
参考文献	第108-115页
致谢	第115-117页
个人简历、在学期间发表的学术论文与研究成果	第117-118页