首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--一般性问题论文--理论、方法论文--算法理论论文

面向异构体系结构的稀疏矩阵算法研究

摘要第11-13页
ABSTRACT第13-14页
第一章 绪论第15-33页
    1.1 异构体系结构第15-24页
        1.1.1 处理器体系结构的发展第15-22页
        1.1.2 高性能计算机体系结构的发展第22-24页
    1.2 稀疏矩阵算法第24-30页
        1.2.1 图遍历算法第25-27页
        1.2.2 稀疏线性方程组求解第27-29页
        1.2.3 异构体系结构下稀疏矩阵算法面临的挑战第29-30页
    1.3 主要工作和创新点第30-31页
    1.4 组织结构第31-33页
第二章 算法背景与实验环境第33-49页
    2.1 面向异构体系结构的编程模型第33-40页
        2.1.1 CPU编程模型第33-36页
        2.1.2 GPU编程模型第36-40页
    2.2 稀疏矩阵算法基础第40-45页
        2.2.1 稀疏矩阵存储格式第40-44页
        2.2.2 稀疏矩阵排序算法第44-45页
    2.3 实验环境第45-49页
        2.3.1 计算平台第45-47页
        2.3.2 编译环境和数学库第47-49页
第三章 面向异构体系结构的宽度优先搜索第49-69页
    3.1 研究背景第49-58页
        3.1.1 图的定义与数据结构第49-50页
        3.1.2 BFS算法描述第50-53页
        3.1.3 相关工作第53-58页
    3.2 面向CPU-GPU异构体系结构的BFS算法第58-65页
        3.2.1 并行BFS算法框架第58-60页
        3.2.2 面向异构体系结构的自底向上的BFS算法第60-64页
        3.2.3 面向异构体系结构的搜索方向优化的BFS算法第64-65页
    3.3 实验评测第65-68页
        3.3.1 测试数据集第65-66页
        3.3.2 测试结果第66-68页
    3.4 本章小结第68-69页
第四章 面向异构体系结构的稀疏矩阵向量乘第69-85页
    4.1 研究背景第69-72页
        4.1.1 算法描述第69-70页
        4.1.2 相关工作第70-72页
    4.2 面向CPU-GPU异构体系结构的SpMV算法第72-79页
        4.2.1 面向SpMV的通用优化策略第72-77页
        4.2.2 面向多核CPU的SpMV优化策略第77-78页
        4.2.3 面向GPU的SpMV优化策略第78-79页
    4.3 实验评测第79-83页
        4.3.1 稀疏矩阵测试集第79-80页
        4.3.2 数据结构优化性能评测第80-82页
        4.3.3 面向计算平台的SpMV优化性能评测第82-83页
    4.4 本章小结第83-85页
第五章 面向异构体系结构的稀疏矩阵分解第85-105页
    5.1 研究背景第85-92页
        5.1.1 算法描述第85-90页
        5.1.2 相关工作第90-92页
    5.2 面向CPU-GPU异构体系结构的稀疏矩阵Cholesky分解算法第92-97页
        5.2.1 超节点的生成、合并与分块第93-94页
        5.2.2 任务定义第94-96页
        5.2.3 任务的生成与调度第96-97页
    5.3 实验评测第97-103页
        5.3.1 稀疏矩阵测试集第97-99页
        5.3.2 任务映射与数据存储方案第99-100页
        5.3.3 超节点合并与分块第100-102页
        5.3.4 基于流和事件的GPU任务并行第102页
        5.3.5 性能对比第102-103页
    5.4 本章小结第103-105页
第六章 面向异构体系结构的稀疏三角方程组求解第105-119页
    6.1 研究背景第105-108页
        6.1.1 算法描述第105-106页
        6.1.2 相关工作第106-108页
    6.2 面向CPU-GPU异构体系结构的Sp TRSV算法第108-113页
        6.2.1 面向稀疏结构的分块处理策略第108-109页
        6.2.2 数据结构优化策略第109页
        6.2.3 面向负载均衡的线程映射第109-110页
        6.2.4 基于warp的计算组织第110-111页
        6.2.5 CPU-GPU协同并行算法第111-113页
    6.3 实验评测第113-117页
        6.3.1 稀疏矩阵测试集第113-114页
        6.3.2 数据结构优化性能评测第114-116页
        6.3.3 负载均衡优化性能评测第116-117页
        6.3.4 CPU-GPU协同计算性能评测第117页
    6.4 本章小结第117-119页
第七章 结论与展望第119-121页
    7.1 工作总结第119-120页
    7.2 研究展望第120-121页
致谢第121-123页
参考文献第123-139页
作者在学期间取得的学术成果第139-141页
作者在学期间参加的科研项目第141页

论文共141页,点击 下载论文
上一篇:弹道中段目标双基地微动特性分析与特征提取
下一篇:冬虫夏草保护生物学研究