摘要 | 第1-5页 |
英文摘要 | 第5-7页 |
目录 | 第7-9页 |
第一章 绪论 | 第9-13页 |
·研究背景 | 第9-10页 |
·相关研究工作 | 第10-12页 |
·论文安排 | 第12-13页 |
第二章 预备知识 | 第13-21页 |
·Krylov子空间方法概述 | 第13-16页 |
·广义极小残差法 | 第14-15页 |
·共轭梯度法 | 第15-16页 |
·预处理技术 | 第16-17页 |
·GPU架构和CUDA编程模型 | 第17-21页 |
第三章 GPU上的稀疏矩阵向量乘及优化 | 第21-41页 |
·引言 | 第21页 |
·稀疏矩阵存储格式 | 第21-27页 |
·对角线存储格式(Diagonal Format,DIA) | 第21-22页 |
·Ell存储格式(Ellpack-Itpack Format) | 第22-23页 |
·坐标存储格式(Coordinate Format,COO) | 第23页 |
·压缩稀疏行存储格式(Compressed Sparse Row Format,CSR) | 第23-24页 |
·混合存储格式(Hybrid Format,HYB) | 第24-25页 |
·分片Ell存储格式(Sliced Ellpack Format,Sliced ELL) | 第25页 |
·齿对角线存储格式(Jagged Diagonals Format,JAD) | 第25-26页 |
·小结 | 第26-27页 |
·BiELL:基于二分法的Ellpack存储格式 | 第27-31页 |
·BiELL格式的构造 | 第27-29页 |
·GPU上基于BiELL格式的SpMV | 第29-31页 |
·BiJAD:基于二分法的JAD存储格式 | 第31页 |
·数值试验 | 第31-40页 |
·规则矩阵 | 第32-34页 |
·不规则矩阵 | 第34-40页 |
·本章小结 | 第40-41页 |
第四章 GPU上的多项式预处理Krylov子空间方法 | 第41-49页 |
·引言 | 第41页 |
·松弛型Neumann多项式预处理 | 第41-43页 |
·数值试验 | 第43-48页 |
·不做预处理的Krylov子空间方法 | 第43-46页 |
·Neumann多项式预处理的Krylov子空间方法 | 第46-48页 |
·本章小结 | 第48-49页 |
第五章 异构并行机上的CG方法 | 第49-55页 |
·引言 | 第49页 |
·异构并行机上CG方法的实现 | 第49-52页 |
·向量内积 | 第49-50页 |
·矩阵向量乘 | 第50-51页 |
·Pipelined CG方法 | 第51-52页 |
·数值试验 | 第52-54页 |
·本章小结 | 第54-55页 |
总结 | 第55-57页 |
参考文献 | 第57-63页 |
发表文章情况 | 第63-65页 |
致谢 | 第65页 |