面向异构体系结构的稀疏矩阵算法研究

摘要	第11-13页
ABSTRACT	第13-14页
第一章绪论	第15-33页
1.1 异构体系结构	第15-24页
1.1.1 处理器体系结构的发展	第15-22页
1.1.2 高性能计算机体系结构的发展	第22-24页
1.2 稀疏矩阵算法	第24-30页
1.2.1 图遍历算法	第25-27页
1.2.2 稀疏线性方程组求解	第27-29页
1.2.3 异构体系结构下稀疏矩阵算法面临的挑战	第29-30页
1.3 主要工作和创新点	第30-31页
1.4 组织结构	第31-33页
第二章算法背景与实验环境	第33-49页
2.1 面向异构体系结构的编程模型	第33-40页
2.1.1 CPU编程模型	第33-36页
2.1.2 GPU编程模型	第36-40页
2.2 稀疏矩阵算法基础	第40-45页
2.2.1 稀疏矩阵存储格式	第40-44页
2.2.2 稀疏矩阵排序算法	第44-45页
2.3 实验环境	第45-49页
2.3.1 计算平台	第45-47页
2.3.2 编译环境和数学库	第47-49页
第三章面向异构体系结构的宽度优先搜索	第49-69页
3.1 研究背景	第49-58页
3.1.1 图的定义与数据结构	第49-50页
3.1.2 BFS算法描述	第50-53页
3.1.3 相关工作	第53-58页
3.2 面向CPU-GPU异构体系结构的BFS算法	第58-65页
3.2.1 并行BFS算法框架	第58-60页
3.2.2 面向异构体系结构的自底向上的BFS算法	第60-64页
3.2.3 面向异构体系结构的搜索方向优化的BFS算法	第64-65页
3.3 实验评测	第65-68页
3.3.1 测试数据集	第65-66页
3.3.2 测试结果	第66-68页
3.4 本章小结	第68-69页
第四章面向异构体系结构的稀疏矩阵向量乘	第69-85页
4.1 研究背景	第69-72页
4.1.1 算法描述	第69-70页
4.1.2 相关工作	第70-72页
4.2 面向CPU-GPU异构体系结构的SpMV算法	第72-79页
4.2.1 面向SpMV的通用优化策略	第72-77页
4.2.2 面向多核CPU的SpMV优化策略	第77-78页
4.2.3 面向GPU的SpMV优化策略	第78-79页
4.3 实验评测	第79-83页
4.3.1 稀疏矩阵测试集	第79-80页
4.3.2 数据结构优化性能评测	第80-82页
4.3.3 面向计算平台的SpMV优化性能评测	第82-83页
4.4 本章小结	第83-85页
第五章面向异构体系结构的稀疏矩阵分解	第85-105页
5.1 研究背景	第85-92页
5.1.1 算法描述	第85-90页
5.1.2 相关工作	第90-92页
5.2 面向CPU-GPU异构体系结构的稀疏矩阵Cholesky分解算法	第92-97页
5.2.1 超节点的生成、合并与分块	第93-94页
5.2.2 任务定义	第94-96页
5.2.3 任务的生成与调度	第96-97页
5.3 实验评测	第97-103页
5.3.1 稀疏矩阵测试集	第97-99页
5.3.2 任务映射与数据存储方案	第99-100页
5.3.3 超节点合并与分块	第100-102页
5.3.4 基于流和事件的GPU任务并行	第102页
5.3.5 性能对比	第102-103页
5.4 本章小结	第103-105页
第六章面向异构体系结构的稀疏三角方程组求解	第105-119页
6.1 研究背景	第105-108页
6.1.1 算法描述	第105-106页
6.1.2 相关工作	第106-108页
6.2 面向CPU-GPU异构体系结构的Sp TRSV算法	第108-113页
6.2.1 面向稀疏结构的分块处理策略	第108-109页
6.2.2 数据结构优化策略	第109页
6.2.3 面向负载均衡的线程映射	第109-110页
6.2.4 基于warp的计算组织	第110-111页
6.2.5 CPU-GPU协同并行算法	第111-113页
6.3 实验评测	第113-117页
6.3.1 稀疏矩阵测试集	第113-114页
6.3.2 数据结构优化性能评测	第114-116页
6.3.3 负载均衡优化性能评测	第116-117页
6.3.4 CPU-GPU协同计算性能评测	第117页
6.4 本章小结	第117-119页
第七章结论与展望	第119-121页
7.1 工作总结	第119-120页
7.2 研究展望	第120-121页
致谢	第121-123页
参考文献	第123-139页
作者在学期间取得的学术成果	第139-141页
作者在学期间参加的科研项目	第141页