基于OpenACC的自动并行化技术研究
致谢 | 第4-5页 |
摘要 | 第5-6页 |
Abstract | 第6页 |
1 绪论 | 第14-19页 |
1.1 研究背景及意义 | 第14-15页 |
1.2 国内外研究现状 | 第15-17页 |
1.3 论文结构与安排 | 第17-19页 |
2 相关技术研究 | 第19-35页 |
2.1 GPU的架构和硬件特点 | 第19-23页 |
2.2 GPU上编程方法简介及对比 | 第23-30页 |
2.3 OpenACC的介绍 | 第30-34页 |
2.4 本章小结 | 第34-35页 |
3 运算代价评估模型研究 | 第35-46页 |
3.1 运算时间使用的模型 | 第35-39页 |
3.2 处理器能耗模型 | 第39-41页 |
3.3 一种新的运算代价模型 | 第41-45页 |
3.4 本章小结 | 第45-46页 |
4 GENACC架构 | 第46-53页 |
4.1 GENACC总体设计 | 第46-49页 |
4.2 并行识别方法步骤 | 第49-50页 |
4.3 自动标注OpenACC指令 | 第50-52页 |
4.4 本章小结 | 第52-53页 |
5 实验分析 | 第53-58页 |
5.1 实验环境 | 第53-54页 |
5.2 运算代价模型实验 | 第54-56页 |
5.3 GENACC实验结果与分析 | 第56-57页 |
5.4 本章小结 | 第57-58页 |
6 总结与展望 | 第58-60页 |
6.1 总结 | 第58-59页 |
6.2 展望 | 第59-60页 |
参考文献 | 第60-65页 |
作者简历 | 第65-67页 |
学位论文数据集 | 第67页 |