面向众核应用的预取和数据浸透技术

摘要	第5-6页
abstract	第6页
第1章绪论	第10-16页
1.1 研究背景及意义	第10-13页
1.1.1 传统多核存在的问题	第11页
1.1.2 影响众核计算性能的因素	第11-12页
1.1.3 众核应用亟待解决的问题	第12-13页
1.1.4 研究意义	第13页
1.2 论文内容和结构	第13-16页
1.2.1 研究内容	第13-14页
1.2.2 本文创新点	第14-15页
1.2.3 论文结构	第15-16页
第2章众核体系结构和编程模型	第16-26页
2.1 众核体系结构介绍	第16-21页
2.1.1 众核与传统多核的差异	第16-17页
2.1.2 GPU体系结构	第17-18页
2.1.3 GPU存储器	第18-19页
2.1.4 AMD GCN架构	第19-21页
2.1.5 NVIDIA Kepler架构	第21页
2.2 众核编程模型	第21-23页
2.2.1 OpenCL编程框架	第22-23页
2.2.2 CUDA平台	第23页
2.3 众核应用特征	第23-24页
2.4 GPU执行模型	第24-25页
2.5 本章小结	第25-26页
第3章基于众核的预取技术	第26-38页
3.1 预取技术相关背景	第26-30页
3.1.1 众核优化原则	第26-27页
3.1.2 硬件支持	第27-28页
3.1.3 预取技术面临的问题	第28-29页
3.1.4 预取技术现状	第29-30页
3.2 帮助线程预取技术	第30-31页
3.2.1 帮助线程预取算法描述	第30页
3.2.2 帮助线程预取实验	第30-31页
3.3 线程间数据预取技术	第31-33页
3.3.1 线程间预取定义	第31-33页
3.3.2 线程间预取算法实现过程	第33页
3.4 实验结果与讨论	第33-36页
3.4.1 实验环境搭建	第33-34页
3.4.2 实验设计	第34页
3.4.3 实验结果	第34-36页
3.5 本章小结	第36-38页
第4章动态数据浸透技术	第38-53页
4.1 传统静态优化方法的问题	第38-39页
4.2 众核处理器的局限性	第39页
4.3 静态调度和数据分片	第39-41页
4.3.1 静态调度	第39-40页
4.3.2 数据分片	第40-41页
4.4 动态调度	第41-43页
4.5 浸透策略	第43-45页
4.5.1 浸透操作定义	第43页
4.5.2 浸透操作算法描述	第43-45页
4.6 实验结果与讨论	第45-52页
4.6.1 实验设计	第45-46页
4.6.2 实验结果	第46-52页
4.7 本章小结	第52-53页
第5章总结与展望	第53-56页
5.1 工作总结	第53-54页
5.2 不足与展望	第54-56页
参考文献	第56-59页
致谢	第59页