GPU集群的并行编程通信接口研究
| 摘要 | 第1-5页 |
| Abstract | 第5-8页 |
| 1 绪论 | 第8-15页 |
| ·引言 | 第8-10页 |
| ·国内外研究概况 | 第10-13页 |
| ·研究内容 | 第13-14页 |
| ·论文的组织结构 | 第14-15页 |
| 2 GPU 集群通信接口的设计方案 | 第15-29页 |
| ·国内外集群通信接口方案对比 | 第15-19页 |
| ·GPU 集群通信接口 CUDAGA 整体设计 | 第19-24页 |
| ·CUDAGA 模块设计 | 第24-28页 |
| ·本章小结 | 第28-29页 |
| 3 GPU 集群通信接口及关键技术 | 第29-41页 |
| ·GPU 集群通信接口的构成与实现 | 第29-30页 |
| ·并行计算初始化 | 第30-33页 |
| ·GPU-to-GPU 数据通信 | 第33-37页 |
| ·节点内性能优化 | 第37-40页 |
| ·本章小结 | 第40-41页 |
| 4 系统测试与分析 | 第41-50页 |
| ·系统环境介绍 | 第41-42页 |
| ·编程复杂度分析 | 第42-44页 |
| ·通信性能测试 | 第44-47页 |
| ·加速的函数库性能测试 | 第47-49页 |
| ·本章小结 | 第49-50页 |
| 5 总结与展望 | 第50-51页 |
| 致谢 | 第51-52页 |
| 参考文献 | 第52-56页 |
| 附录1 攻读学位期间发表论文目录 | 第56页 |
| 附录2 攻读学位期间申请的国家发明专利目录 | 第56页 |