摘要 | 第1-4页 |
Abstract | 第4-8页 |
1 绪论 | 第8-17页 |
·技术背景 | 第8-13页 |
·什么是GPGPU? | 第8-12页 |
·为什么要利用GPU 进行通用计算? | 第12-13页 |
·研究进展 | 第13-16页 |
·本文的研究内容和章节安排 | 第16-17页 |
2 GPU 编程模型 | 第17-34页 |
·GPU 体系结构 | 第17-21页 |
·对流数据的编程 | 第21-23页 |
·GPU 的存储系统 | 第23-28页 |
·存储系统体系结构 | 第24页 |
·GPU 中数据流的类型 | 第24-28页 |
·GPU 内核对存储器的访问 | 第28-29页 |
·GPGPU 的数据结构 | 第29-34页 |
·浮点数 | 第29-30页 |
·数组 | 第30-33页 |
·结构体 | 第33页 |
·稀疏数据结构 | 第33-34页 |
3 GPU 程序的优化 | 第34-39页 |
·并行性 | 第34-35页 |
·指令级并行性 | 第34-35页 |
·数据级并行性 | 第35页 |
·代码优化 | 第35-38页 |
·预先计算循环变量 | 第35-36页 |
·分支语句 | 第36页 |
·变scatter 操作为gather 操作 | 第36-38页 |
·有限的输出和缓慢的回读 | 第38-39页 |
4 基于GPU 的向量代数运算框架 | 第39-47页 |
·数据的表示 | 第39-42页 |
·单个浮点数的表示 | 第39页 |
·向量的表示 | 第39-40页 |
·矩阵的表示 | 第40-42页 |
·数据操作 | 第42-45页 |
·向量运算 | 第42-43页 |
·向量约减 | 第43页 |
·矩阵与向量乘法 | 第43-45页 |
·程序框架 | 第45-47页 |
5 GPGPU 在游戏中的应用案例 | 第47-58页 |
·基于物理的水面渲染 | 第47-53页 |
·共轭梯度法 | 第47-48页 |
·二维波方程 | 第48-51页 |
·性能分析 | 第51-53页 |
·利用GPU 处理人工神经元网络 | 第53-56页 |
·人工神经元网络 | 第54-55页 |
·实现 | 第55-56页 |
·利用GPU 加速Floyd-Warshall 算法 | 第56-58页 |
·CPU 上的Floyd-Warshall 算法 | 第56-57页 |
·GPU 上的Floyd-Warshall 算法 | 第57-58页 |
结论 | 第58-59页 |
参考文献 | 第59-61页 |
攻读硕士学位期间发表学术论文情况 | 第61-62页 |
致谢 | 第62页 |