基于CUDA的简化并行编程方案设计
摘要 | 第1-5页 |
Abstract | 第5-8页 |
引言 | 第8-11页 |
1 背景介绍 | 第11-26页 |
·并行计算 | 第11-12页 |
·CUDA并行计算架构 | 第12-24页 |
·GPGPU体系结构 | 第13-16页 |
·CUDA编程模型 | 第16-23页 |
·GPUDirect | 第23-24页 |
·任务场景 | 第24-26页 |
2 双层并行 | 第26-32页 |
·GPGPU设备内并行 | 第26-28页 |
·GPGPU设备间并行 | 第28-32页 |
·全局设备队列 | 第29页 |
·数据复用 | 第29-31页 |
·任务调度策略 | 第31-32页 |
3 多地址空间封装技术 | 第32-44页 |
·数据封装 | 第35页 |
·数据操作封装 | 第35-39页 |
·Kernel函数执行 | 第35-37页 |
·前处理操作 | 第37-38页 |
·后处理操作 | 第38页 |
·基础操作 | 第38-39页 |
·优势与劣势 | 第39-42页 |
·程序简化实例 | 第42-44页 |
4 源码转换技术 | 第44-47页 |
5 设计与实现 | 第47-52页 |
·GPGPU设备间并行的设计与实现 | 第47-50页 |
·通信模块 | 第47-49页 |
·设备队列维护模块 | 第49页 |
·数据复用模块 | 第49-50页 |
·任务调度模块 | 第50页 |
·任务执行模块 | 第50页 |
·多地址空间封装的设计与实现 | 第50-51页 |
·源码转换技术的设计与实现 | 第51-52页 |
6 实验 | 第52-58页 |
·实验环境 | 第52页 |
·实验设置 | 第52-53页 |
·实验结果与分析 | 第53-58页 |
结论 | 第58-60页 |
参考文献 | 第60-63页 |
攻读硕士学位期间发表学术论文情况 | 第63-64页 |
致谢 | 第64-65页 |