异构GPU集群的并行编程模型及实现

目录	第3-6页
摘要	第6-8页
Abstract	第8-9页
第一章绪论	第10-16页
1.1 研究背景	第10-12页
1.2 研究现状	第12-14页
1.3 研究内容	第14-15页
1.4 本文创新点	第15页
1.5 全文组织与安排	第15-16页
第二章异构GPU集群介绍	第16-26页
2.1 传统集群体系结构	第16-17页
2.2 加速器GPU	第17-19页
2.2.1 GPU的特点	第17-18页
2.2.2 GPU的发展	第18-19页
2.3 GPU编程模型	第19-25页
2.3.1 CUDA	第20-22页
2.3.2 OpenCL	第22-24页
2.3.3 OpenACC	第24-25页
2.4 异构GPU集群体系结构	第25-26页
第三章数据流模型	第26-37页
3.1 数据流模型的基本概念	第27-28页
3.2 数据流模型的特点	第28-29页
3.3 流模型分类	第29-33页
3.3.1 同步数据流SDF模型	第30页
3.3.2 循环静态数据流CSDF	第30-31页
3.3.3 布尔数据流BDF	第31页
3.3.4 整形数据流IDF模型	第31页
3.3.5 循环动态数据流CDDF模型	第31-32页
3.3.6 动态数据流DDF	第32-33页
3.4 并行程序设计模型	第33-37页
3.4.1 数据并行模型	第34页
3.4.2 隐式并行模型	第34-35页
3.4.3 消息传递模型	第35-36页
3.4.4 共享变量模型	第36-37页
第四章 DISPAR编程模型	第37-46页
4.1 系统模型	第39-42页
4.2 虚拟处理单元	第42-43页
4.3 管道	第43页
4.4 通信原语	第43-44页
4.5 兼容OpenACC	第44-46页
第五章 StreamCC预处理系统	第46-66页
5.1 数据结构	第46-49页
5.2 StreamCC的实现的流程框架图	第49页
5.3 StreamCC的核心模块	第49-60页
5.3.1 代码解析模块	第49-56页
5.3.2 进程框架生成模块	第56页
5.3.3 代码生成模块	第56-60页
5.4 Example	第60-64页
5.5 实验结果	第64-66页
5.5.1 代码规模比较	第64-65页
5.5.2 性能比较	第65-66页
第六章总结与展望	第66-68页
6.1 总结	第66-67页
6.2 进一步的工作	第67-68页
参考文献	第68-70页
读硕士期间公开发表的论文	第70-71页
致谢	第71-73页