| 摘要 | 第1-5页 |
| 英文摘要 | 第5-7页 |
| 目录 | 第7-9页 |
| 第一章 绪论 | 第9-13页 |
| ·研究背景 | 第9-10页 |
| ·相关研究工作 | 第10-12页 |
| ·论文安排 | 第12-13页 |
| 第二章 预备知识 | 第13-21页 |
| ·Krylov子空间方法概述 | 第13-16页 |
| ·广义极小残差法 | 第14-15页 |
| ·共轭梯度法 | 第15-16页 |
| ·预处理技术 | 第16-17页 |
| ·GPU架构和CUDA编程模型 | 第17-21页 |
| 第三章 GPU上的稀疏矩阵向量乘及优化 | 第21-41页 |
| ·引言 | 第21页 |
| ·稀疏矩阵存储格式 | 第21-27页 |
| ·对角线存储格式(Diagonal Format,DIA) | 第21-22页 |
| ·Ell存储格式(Ellpack-Itpack Format) | 第22-23页 |
| ·坐标存储格式(Coordinate Format,COO) | 第23页 |
| ·压缩稀疏行存储格式(Compressed Sparse Row Format,CSR) | 第23-24页 |
| ·混合存储格式(Hybrid Format,HYB) | 第24-25页 |
| ·分片Ell存储格式(Sliced Ellpack Format,Sliced ELL) | 第25页 |
| ·齿对角线存储格式(Jagged Diagonals Format,JAD) | 第25-26页 |
| ·小结 | 第26-27页 |
| ·BiELL:基于二分法的Ellpack存储格式 | 第27-31页 |
| ·BiELL格式的构造 | 第27-29页 |
| ·GPU上基于BiELL格式的SpMV | 第29-31页 |
| ·BiJAD:基于二分法的JAD存储格式 | 第31页 |
| ·数值试验 | 第31-40页 |
| ·规则矩阵 | 第32-34页 |
| ·不规则矩阵 | 第34-40页 |
| ·本章小结 | 第40-41页 |
| 第四章 GPU上的多项式预处理Krylov子空间方法 | 第41-49页 |
| ·引言 | 第41页 |
| ·松弛型Neumann多项式预处理 | 第41-43页 |
| ·数值试验 | 第43-48页 |
| ·不做预处理的Krylov子空间方法 | 第43-46页 |
| ·Neumann多项式预处理的Krylov子空间方法 | 第46-48页 |
| ·本章小结 | 第48-49页 |
| 第五章 异构并行机上的CG方法 | 第49-55页 |
| ·引言 | 第49页 |
| ·异构并行机上CG方法的实现 | 第49-52页 |
| ·向量内积 | 第49-50页 |
| ·矩阵向量乘 | 第50-51页 |
| ·Pipelined CG方法 | 第51-52页 |
| ·数值试验 | 第52-54页 |
| ·本章小结 | 第54-55页 |
| 总结 | 第55-57页 |
| 参考文献 | 第57-63页 |
| 发表文章情况 | 第63-65页 |
| 致谢 | 第65页 |