异构GPU集群的并行编程模型及实现
目录 | 第3-6页 |
摘要 | 第6-8页 |
Abstract | 第8-9页 |
第一章 绪论 | 第10-16页 |
1.1 研究背景 | 第10-12页 |
1.2 研究现状 | 第12-14页 |
1.3 研究内容 | 第14-15页 |
1.4 本文创新点 | 第15页 |
1.5 全文组织与安排 | 第15-16页 |
第二章 异构GPU集群介绍 | 第16-26页 |
2.1 传统集群体系结构 | 第16-17页 |
2.2 加速器GPU | 第17-19页 |
2.2.1 GPU的特点 | 第17-18页 |
2.2.2 GPU的发展 | 第18-19页 |
2.3 GPU编程模型 | 第19-25页 |
2.3.1 CUDA | 第20-22页 |
2.3.2 OpenCL | 第22-24页 |
2.3.3 OpenACC | 第24-25页 |
2.4 异构GPU集群体系结构 | 第25-26页 |
第三章 数据流模型 | 第26-37页 |
3.1 数据流模型的基本概念 | 第27-28页 |
3.2 数据流模型的特点 | 第28-29页 |
3.3 流模型分类 | 第29-33页 |
3.3.1 同步数据流SDF模型 | 第30页 |
3.3.2 循环静态数据流CSDF | 第30-31页 |
3.3.3 布尔数据流BDF | 第31页 |
3.3.4 整形数据流IDF模型 | 第31页 |
3.3.5 循环动态数据流CDDF模型 | 第31-32页 |
3.3.6 动态数据流DDF | 第32-33页 |
3.4 并行程序设计模型 | 第33-37页 |
3.4.1 数据并行模型 | 第34页 |
3.4.2 隐式并行模型 | 第34-35页 |
3.4.3 消息传递模型 | 第35-36页 |
3.4.4 共享变量模型 | 第36-37页 |
第四章 DISPAR编程模型 | 第37-46页 |
4.1 系统模型 | 第39-42页 |
4.2 虚拟处理单元 | 第42-43页 |
4.3 管道 | 第43页 |
4.4 通信原语 | 第43-44页 |
4.5 兼容OpenACC | 第44-46页 |
第五章 StreamCC预处理系统 | 第46-66页 |
5.1 数据结构 | 第46-49页 |
5.2 StreamCC的实现的流程框架图 | 第49页 |
5.3 StreamCC的核心模块 | 第49-60页 |
5.3.1 代码解析模块 | 第49-56页 |
5.3.2 进程框架生成模块 | 第56页 |
5.3.3 代码生成模块 | 第56-60页 |
5.4 Example | 第60-64页 |
5.5 实验结果 | 第64-66页 |
5.5.1 代码规模比较 | 第64-65页 |
5.5.2 性能比较 | 第65-66页 |
第六章 总结与展望 | 第66-68页 |
6.1 总结 | 第66-67页 |
6.2 进一步的工作 | 第67-68页 |
参考文献 | 第68-70页 |
读硕士期间公开发表的论文 | 第70-71页 |
致谢 | 第71-73页 |