基于OpenCL的稀疏矩阵向量乘优化
| 摘要 | 第1-5页 |
| Abstract | 第5-9页 |
| 第1章 引言 | 第9-15页 |
| ·课题背景 | 第9-11页 |
| ·基本概念 | 第11-13页 |
| ·课题研究的意义及论文简介 | 第13-15页 |
| 第2章 OpenCL 架构及 GPU 架构 | 第15-32页 |
| ·OpenCL 架构 | 第15-22页 |
| ·OpenCL 四种模型 | 第15-22页 |
| ·OpenCL C | 第22-24页 |
| ·内建数据类型 | 第22-24页 |
| ·GPU 架构 | 第24-31页 |
| ·传统的 CPU 架构 | 第24-26页 |
| ·AMD GPU 架构 | 第26-27页 |
| ·Nvdia GPU 架构 | 第27-31页 |
| ·OpenCL 的编译系统 | 第31-32页 |
| 第3章 OpenCL 的优化编程技术 | 第32-42页 |
| ·内存访问的优化技术 | 第32-36页 |
| ·全局内存访存模式 | 第32-34页 |
| ·局部内存访存模式 | 第34-36页 |
| ·数据传输优化 | 第36-37页 |
| ·控制流优化 | 第37-38页 |
| ·其他优化技术 | 第38-42页 |
| ·内建数学函数 | 第38-39页 |
| ·线程映射 | 第39-40页 |
| ·使用合理的数据结构 | 第40-42页 |
| 第4章 基于 OpenCL 的 SPMV 优化 | 第42-53页 |
| ·开发环境的介绍 | 第42-45页 |
| ·稀疏矩阵的 CSR 格式 | 第45-46页 |
| ·一个 wave 处理一行数据 | 第46-47页 |
| ·一个线程和一个 wave 的折中方法 | 第47页 |
| ·其他优化方法 | 第47-49页 |
| ·利用图像对象 | 第48页 |
| ·量化内核 | 第48-49页 |
| ·测试和分析 | 第49-53页 |
| ·测试环境 | 第49页 |
| ·优化策略效果 | 第49-53页 |
| 第5章 结束语 | 第53-54页 |
| ·工作总结 | 第53页 |
| ·展望 | 第53-54页 |
| 参考文献 | 第54-56页 |
| 致谢 | 第56页 |