首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

射流爆震模拟软件的异构众核并行技术研究

摘要第9-10页
abstract第10-11页
第一章 绪论第12-20页
    1.1 计算流体力学简介第12页
    1.2 燃烧数值模拟简介第12-13页
    1.3 异构众核体系结构简介第13-15页
        1.3.1 MIC体系结构第14-15页
    1.4 科学计算应用异构众核平台移植第15-16页
    1.5 本文研究的意义第16-17页
    1.6 相关研究现状第17页
    1.7 研究内容第17-20页
        1.7.1 主要工作及贡献第17-18页
        1.7.2 论文结构第18-20页
第二章 AMROC框架及其射流爆震燃烧模拟应用性能分析第20-30页
    2.1 引言第20页
    2.2 AMROC框架分析第20-23页
        2.2.1 顶层设计第21页
        2.2.2 中层设计第21-22页
        2.2.3 底层设计第22-23页
    2.3 AMRCO分布式并行算法与通信研究第23-24页
    2.4 Initition3d软件性能分析第24-29页
        2.4.1 测试应用第24页
        2.4.2 测试平台与测试方法第24-25页
        2.4.3 程序执行时间及并行效率第25-26页
        2.4.4 程序各个部分的开销分析第26-27页
        2.4.5 程序的MPI通信性能测试第27-29页
    2.5 本章小结第29-30页
第三章 射流爆震模拟软件的OpenMP并行化及性能分析第30-43页
    3.1 引言第30页
    3.2 Initition3d计算流程分析第30-31页
    3.3 OpenMP并行算法设计与优化第31-35页
        3.3.1 OpenMP并行化的难点第31-32页
        3.3.2 热点测试分析第32-33页
        3.3.3 并行算法实现第33-34页
        3.3.4 并行算法优化第34-35页
    3.4 结果测试与分析第35-42页
        3.4.1 测试平台与测试算例第35-36页
        3.4.2 程序的OpenMP并行效率测试第36-37页
        3.4.3 MPI/OpenMP两级并行性能测试第37-38页
        3.4.4 并行效率下降的原因测试分析第38-42页
    3.5 本章小结第42-43页
第四章 射流爆震模拟软件的初步异构并行实现第43-58页
    4.1 引言第43页
    4.2 OpenMP4.0编程介绍第43-45页
    4.3 主要计算部分的offload移植第45-49页
        4.3.1 Offload子程序选择第45-46页
        4.3.2 移植的难点分析第46-48页
        4.3.3 offload移植的实现第48-49页
    4.4 性能优化措施第49-51页
        4.4.1 编译器选项优化第49页
        4.4.2 向量化优化第49-50页
        4.4.3 OpenMP线程优化第50页
        4.4.4 CPU与MIC之间的数据传输优化第50-51页
    4.5 核心代码在CPU与MIC上的性对比第51-56页
        4.5.1 测试平台与测试算例第51页
        4.5.2 性能对比测试第51-53页
        4.5.3 对比结果分析第53-56页
    4.6 本章小结第56-58页
第五章 总结与展望第58-60页
    5.1 全文总结第58-59页
    5.2 研究展望第59-60页
致谢第60-61页
参考文献第61-65页
作者在学期间取得的学术成果第65页

论文共65页,点击 下载论文
上一篇:P-R开发模式在软件工程课程实践教学中的应用研究
下一篇:浮点程序符号执行关键技术研究