首页--数理科学和化学论文--计算数学论文--数值并行计算论文

基于CPU-GPU异构平台的粒子输运方程的求解

摘要第5-6页
Abstract第6-7页
第1章 绪论第12-18页
    1.1 课题研究背景及目的第12-14页
        1.1.1 粒子输运理论的发展第12-13页
        1.1.2 CPU-GPU异构平台以及协同并行计算的发展第13-14页
        1.1.3 研究的目的及意义第14页
    1.2 国内外研究现状第14-16页
    1.3 本文的主要工作第16-17页
    1.4 本文的组织第17-18页
第2章 CPU-GPU异构体系结构与并行编程模型第18-28页
    2.1 CPU-GPU异构体系结构第18-21页
        2.1.1 CPU与GPU的比较第18-19页
        2.1.2 CPU-GPU异构体系结构第19-20页
        2.1.3 “天河-1A”系统介绍第20-21页
    2.2 并行编程模型第21-27页
        2.2.1 MPI并行编程模型第21-22页
        2.2.2 OpenMP并行编程模型第22-23页
        2.2.3 CUDA并行编程模型第23-27页
    2.3 本章小结第27-28页
第3章 基于GPU的Sweep3D并行实现第28-40页
    3.1 粒子输运的相关背景知识第28-30页
        3.1.1 粒子输运的基本概念第28-29页
        3.1.2 三维笛卡尔坐标下的粒子输运方程第29页
        3.1.3 离散纵坐标法第29-30页
    3.2 Sweep3D概述第30-32页
    3.3 Sweep3D的GPU并行实现第32-33页
    3.4 Sweep3D的GPU并行优化第33-37页
        3.4.1 全局存储器访问优化第33-35页
        3.4.2 消除数据依赖第35-36页
        3.4.3 线程块大小优化第36-37页
    3.5 实验第37-39页
        3.5.1 线程块大小对Sweep3D-GPU性能的影响第37-38页
        3.5.2 Sweep3D-GPU优化前后性能比较第38-39页
    3.6 本章小结第39-40页
第4章 基于CPU-GPU的Sweep3D协同并行实现第40-58页
    4.1 CPU-GPU协同并行算法研究第40-42页
        4.1.1 CPU-GPU协同并行算法分类第40-41页
        4.1.2 MPI-OpenMP-CUDA并行编程模型第41-42页
    4.2 Sweep3D协同并行实现过程分析第42-45页
        4.2.1 协同并行实现总体流程第42-43页
        4.2.2 波阵面扫描过程的协同并行实现第43-45页
    4.3 负载均衡第45-50页
        4.3.1 静态任务划分模型第46-48页
        4.3.2 动态任务划分模型第48-50页
    4.4 数据传输优化第50-53页
        4.4.1 页锁定内存与CUDA流第50-51页
        4.4.2 通信与计算重叠第51-53页
    4.5 实验第53-57页
        4.5.1 任务划分模型测试第53-55页
        4.5.2 数据传输优化测试第55-56页
        4.5.3 协同并行算法性能测试第56-57页
    4.6 本章小结第57-58页
结论第58-61页
参考文献第61-65页
致谢第65-66页
附录A (攻读硕士学位期间所发表的学术论文目录)第66-67页
附录B (攻读硕士学位期间所参与的学术科研活动)第67页

论文共67页,点击 下载论文
上一篇:基于CO2排放的中国旅游全要素生产率研究
下一篇:基于网络同步方法的复杂网络拓扑识别