摘要 | 第11-13页 |
ABSTRACT | 第13-14页 |
第一章 绪论 | 第15-33页 |
1.1 异构体系结构 | 第15-24页 |
1.1.1 处理器体系结构的发展 | 第15-22页 |
1.1.2 高性能计算机体系结构的发展 | 第22-24页 |
1.2 稀疏矩阵算法 | 第24-30页 |
1.2.1 图遍历算法 | 第25-27页 |
1.2.2 稀疏线性方程组求解 | 第27-29页 |
1.2.3 异构体系结构下稀疏矩阵算法面临的挑战 | 第29-30页 |
1.3 主要工作和创新点 | 第30-31页 |
1.4 组织结构 | 第31-33页 |
第二章 算法背景与实验环境 | 第33-49页 |
2.1 面向异构体系结构的编程模型 | 第33-40页 |
2.1.1 CPU编程模型 | 第33-36页 |
2.1.2 GPU编程模型 | 第36-40页 |
2.2 稀疏矩阵算法基础 | 第40-45页 |
2.2.1 稀疏矩阵存储格式 | 第40-44页 |
2.2.2 稀疏矩阵排序算法 | 第44-45页 |
2.3 实验环境 | 第45-49页 |
2.3.1 计算平台 | 第45-47页 |
2.3.2 编译环境和数学库 | 第47-49页 |
第三章 面向异构体系结构的宽度优先搜索 | 第49-69页 |
3.1 研究背景 | 第49-58页 |
3.1.1 图的定义与数据结构 | 第49-50页 |
3.1.2 BFS算法描述 | 第50-53页 |
3.1.3 相关工作 | 第53-58页 |
3.2 面向CPU-GPU异构体系结构的BFS算法 | 第58-65页 |
3.2.1 并行BFS算法框架 | 第58-60页 |
3.2.2 面向异构体系结构的自底向上的BFS算法 | 第60-64页 |
3.2.3 面向异构体系结构的搜索方向优化的BFS算法 | 第64-65页 |
3.3 实验评测 | 第65-68页 |
3.3.1 测试数据集 | 第65-66页 |
3.3.2 测试结果 | 第66-68页 |
3.4 本章小结 | 第68-69页 |
第四章 面向异构体系结构的稀疏矩阵向量乘 | 第69-85页 |
4.1 研究背景 | 第69-72页 |
4.1.1 算法描述 | 第69-70页 |
4.1.2 相关工作 | 第70-72页 |
4.2 面向CPU-GPU异构体系结构的SpMV算法 | 第72-79页 |
4.2.1 面向SpMV的通用优化策略 | 第72-77页 |
4.2.2 面向多核CPU的SpMV优化策略 | 第77-78页 |
4.2.3 面向GPU的SpMV优化策略 | 第78-79页 |
4.3 实验评测 | 第79-83页 |
4.3.1 稀疏矩阵测试集 | 第79-80页 |
4.3.2 数据结构优化性能评测 | 第80-82页 |
4.3.3 面向计算平台的SpMV优化性能评测 | 第82-83页 |
4.4 本章小结 | 第83-85页 |
第五章 面向异构体系结构的稀疏矩阵分解 | 第85-105页 |
5.1 研究背景 | 第85-92页 |
5.1.1 算法描述 | 第85-90页 |
5.1.2 相关工作 | 第90-92页 |
5.2 面向CPU-GPU异构体系结构的稀疏矩阵Cholesky分解算法 | 第92-97页 |
5.2.1 超节点的生成、合并与分块 | 第93-94页 |
5.2.2 任务定义 | 第94-96页 |
5.2.3 任务的生成与调度 | 第96-97页 |
5.3 实验评测 | 第97-103页 |
5.3.1 稀疏矩阵测试集 | 第97-99页 |
5.3.2 任务映射与数据存储方案 | 第99-100页 |
5.3.3 超节点合并与分块 | 第100-102页 |
5.3.4 基于流和事件的GPU任务并行 | 第102页 |
5.3.5 性能对比 | 第102-103页 |
5.4 本章小结 | 第103-105页 |
第六章 面向异构体系结构的稀疏三角方程组求解 | 第105-119页 |
6.1 研究背景 | 第105-108页 |
6.1.1 算法描述 | 第105-106页 |
6.1.2 相关工作 | 第106-108页 |
6.2 面向CPU-GPU异构体系结构的Sp TRSV算法 | 第108-113页 |
6.2.1 面向稀疏结构的分块处理策略 | 第108-109页 |
6.2.2 数据结构优化策略 | 第109页 |
6.2.3 面向负载均衡的线程映射 | 第109-110页 |
6.2.4 基于warp的计算组织 | 第110-111页 |
6.2.5 CPU-GPU协同并行算法 | 第111-113页 |
6.3 实验评测 | 第113-117页 |
6.3.1 稀疏矩阵测试集 | 第113-114页 |
6.3.2 数据结构优化性能评测 | 第114-116页 |
6.3.3 负载均衡优化性能评测 | 第116-117页 |
6.3.4 CPU-GPU协同计算性能评测 | 第117页 |
6.4 本章小结 | 第117-119页 |
第七章 结论与展望 | 第119-121页 |
7.1 工作总结 | 第119-120页 |
7.2 研究展望 | 第120-121页 |
致谢 | 第121-123页 |
参考文献 | 第123-139页 |
作者在学期间取得的学术成果 | 第139-141页 |
作者在学期间参加的科研项目 | 第141页 |