| 摘要 | 第1-4页 |
| Abstract | 第4-8页 |
| 1 绪论 | 第8-17页 |
| ·技术背景 | 第8-13页 |
| ·什么是GPGPU? | 第8-12页 |
| ·为什么要利用GPU 进行通用计算? | 第12-13页 |
| ·研究进展 | 第13-16页 |
| ·本文的研究内容和章节安排 | 第16-17页 |
| 2 GPU 编程模型 | 第17-34页 |
| ·GPU 体系结构 | 第17-21页 |
| ·对流数据的编程 | 第21-23页 |
| ·GPU 的存储系统 | 第23-28页 |
| ·存储系统体系结构 | 第24页 |
| ·GPU 中数据流的类型 | 第24-28页 |
| ·GPU 内核对存储器的访问 | 第28-29页 |
| ·GPGPU 的数据结构 | 第29-34页 |
| ·浮点数 | 第29-30页 |
| ·数组 | 第30-33页 |
| ·结构体 | 第33页 |
| ·稀疏数据结构 | 第33-34页 |
| 3 GPU 程序的优化 | 第34-39页 |
| ·并行性 | 第34-35页 |
| ·指令级并行性 | 第34-35页 |
| ·数据级并行性 | 第35页 |
| ·代码优化 | 第35-38页 |
| ·预先计算循环变量 | 第35-36页 |
| ·分支语句 | 第36页 |
| ·变scatter 操作为gather 操作 | 第36-38页 |
| ·有限的输出和缓慢的回读 | 第38-39页 |
| 4 基于GPU 的向量代数运算框架 | 第39-47页 |
| ·数据的表示 | 第39-42页 |
| ·单个浮点数的表示 | 第39页 |
| ·向量的表示 | 第39-40页 |
| ·矩阵的表示 | 第40-42页 |
| ·数据操作 | 第42-45页 |
| ·向量运算 | 第42-43页 |
| ·向量约减 | 第43页 |
| ·矩阵与向量乘法 | 第43-45页 |
| ·程序框架 | 第45-47页 |
| 5 GPGPU 在游戏中的应用案例 | 第47-58页 |
| ·基于物理的水面渲染 | 第47-53页 |
| ·共轭梯度法 | 第47-48页 |
| ·二维波方程 | 第48-51页 |
| ·性能分析 | 第51-53页 |
| ·利用GPU 处理人工神经元网络 | 第53-56页 |
| ·人工神经元网络 | 第54-55页 |
| ·实现 | 第55-56页 |
| ·利用GPU 加速Floyd-Warshall 算法 | 第56-58页 |
| ·CPU 上的Floyd-Warshall 算法 | 第56-57页 |
| ·GPU 上的Floyd-Warshall 算法 | 第57-58页 |
| 结论 | 第58-59页 |
| 参考文献 | 第59-61页 |
| 攻读硕士学位期间发表学术论文情况 | 第61-62页 |
| 致谢 | 第62页 |