首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

CPU-GPU异构数据流优化及其在气动力数值算法中的应用

摘要第4-6页
ABSTRACT第6-7页
第一章 绪论第11-22页
    1.1 研究背景及意义第11-15页
        1.1.1 CPU-GPU异构计算环境第11-12页
        1.1.2 气动力数值算法的研究第12-13页
        1.1.3 研究意义第13-15页
    1.2 国内外研究现状第15-20页
        1.2.1 CUDA访存方式的发展第15-17页
        1.2.2 NVLink提升数据流传输第17-19页
        1.2.3 IBM的CAPI架构第19页
        1.2.4 国内外GPU加速第19-20页
    1.3 主要研究内容第20-21页
    1.4 组织结构第21-22页
第二章 相关技术研究第22-33页
    2.1 CUDA统一设备模型的演变第22-25页
        2.1.1 Tesla架构第22-23页
        2.1.2 Fermi架构第23页
        2.1.3 Kepler架构第23-24页
        2.1.4 Maxwell架构第24-25页
        2.1.5 Pascal架构第25页
    2.2 CUDA模型第25-30页
        2.2.1 执行模型第25-27页
        2.2.2 存储模型第27-30页
        2.2.3 流和事件第30页
    2.3 CUDA MPS第30-31页
    2.4 CUDA动态并行第31-32页
    2.5 本章小结第32-33页
第三章 CPU-GPU数据流优化第33-57页
    3.1 程序执行时间检测第33-34页
        3.1.1 程序插桩第33-34页
        3.1.2 gprof分析工具第34页
    3.2 数据流的处理模型第34-37页
        3.2.1 数据流概述第34-35页
        3.2.2 基于GPU数据流处理模型框架第35-37页
    3.3 数据流处理具体过程第37-43页
        3.3.1 数据来源第37-38页
        3.3.2 执行过程第38-40页
        3.3.3 数据流处理流程第40-43页
    3.4 数据流处理瓶颈分析第43-46页
        3.4.1 数据流传输第43-44页
        3.4.2 数据流的存取第44-45页
        3.4.3 数据流加工过程第45-46页
    3.5 Hyper-Q优化数据流第46-47页
    3.6 纹理内存优化数据流第47-48页
    3.7 实验及结果分析第48-55页
        3.7.1 数值验证第49-50页
        3.7.2 CPU-GPU测试第50-51页
        3.7.3 线程块配置测试第51-53页
        3.7.4 纹理内存优化测试第53页
        3.7.5 GPU利用率测试第53-55页
    3.8 数据依赖性第55-56页
        3.8.1 数据依赖问题第55页
        3.8.2 数据依赖性的解决方式第55-56页
    3.9 本章小结第56-57页
第四章 MPI-GPU的性能优化第57-69页
    4.1 GPU上下文第57-58页
        4.1.1 上下文简介第57页
        4.1.2 上下文的切换开销第57-58页
    4.2 MPI-GPU架构第58-62页
        4.2.1 MPI概述第58页
        4.2.2 MPI-CPU架构第58-59页
        4.2.3 MPI-GPU架构第59-62页
    4.3 MPI-GPU中MPS的使用第62-65页
        4.3.1 GPU的工作模式第62页
        4.3.2 MPS结构第62-64页
        4.3.3 MPS的优势第64-65页
    4.4 实验及结果分析第65-68页
        4.4.1 MPI-CPU实验第65-66页
        4.4.2 MPI-GPU实验第66-68页
        4.4.3 MPS实验第68页
    4.5 本章小结第68-69页
第五章 数据集并行第69-75页
    5.1 数据单元的形成第69-72页
        5.1.1 四面体网格第69-70页
        5.1.2 六面体网格第70页
        5.1.3 数据集第70-72页
    5.2 基于GPU的数据集并行案例第72-74页
    5.3 本章小结第74-75页
第六章 总结与展望第75-78页
    6.1 总结第75-76页
    6.2 展望第76-78页
参考文献第78-82页
致谢第82-83页
攻读学位期间发表的学术论文目录第83页

论文共83页,点击 下载论文
上一篇:NFC多应用智能手环的设计与实现
下一篇:基于SDN的云数据中心虚拟机迁移策略研究