首页--数理科学和化学论文--力学论文--流体力学论文--普通流体力学论文--流体动力学论文

基于OpenMP 4.0的CFD应用异构并行技术研究

英文缩写词对照表第10-11页
摘要第11-12页
ABSTRACT第12-13页
第一章 绪论第14-22页
    1.1 研究背景及意义第14-18页
        1.1.1 计算流体力学简介第14-16页
        1.1.2 燃烧数值模拟简介第16-17页
        1.1.3 CPU/MIC异构计算第17-18页
    1.2 国内外研究现状第18-20页
        1.2.1 CFD应用的MIC并行研究现状第18-19页
        1.2.2 燃烧数值模拟研究现状第19页
        1.2.3 OpenMP 4.0异构编程研究现状第19-20页
    1.3 研究内容第20-21页
    1.4 组织结构第21-22页
第二章 相关背景技术介绍第22-32页
    2.1 结构网格CFD并行计算特点第22-23页
    2.2 MIC体系结构及编程模型第23-26页
        2.2.1 MIC架构特点第23-24页
        2.2.2 MIC编程模式第24-26页
        2.2.3 Offload模式下的全局优化策略第26页
    2.3 MIC编程语言第26-30页
        2.3.1 Intel's LEO第27-28页
        2.3.2 OpenMP 4.0第28-30页
    2.4 Intel性能分析工具第30-31页
        2.4.1 Intel VTune Amplifier XE第30-31页
        2.4.2 Intel Trace Analyzer and Collector第31页
    2.5 本章小结第31-32页
第三章 计算性能优化与OpenMP并行化第32-43页
    3.1 LESAP程序分析第32-35页
        3.1.1 程序计算流程第32-33页
        3.1.2 计算热点分析第33-34页
        3.1.3 计算与通信特点分析第34-35页
    3.2 OpenMP并行化第35-38页
        3.2.1 OpenMP多线程并行化第35-36页
        3.2.2 流水并行,克服数据相关性第36-38页
    3.3 提高计算与通信性能的代码优化变换第38-40页
        3.3.1 求幂优化第38-39页
        3.3.2 手工算法优化第39页
        3.3.3 通信优化第39-40页
    3.4 性能测试第40-42页
        3.4.1 OpenMP并行效率测试第41-42页
        3.4.2 各优化版本相对于基准版本的运行时间加速比第42页
    3.5 本章小结第42-43页
第四章 基于OpenMP 4.0的CPU+MIC异构移植与优化第43-57页
    4.1 OpenMP 4.0实现CPU+MIC异构移植第43-47页
        4.1.1 异构并行计算模式的设计与实现第43-45页
        4.1.2 进线程绑定与混合编程第45-46页
        4.1.3 OpenMP 4.0异构移植LEASP第46-47页
    4.2 面向CPU+MIC异构系统的性能优化第47-51页
        4.2.1 CPU与MIC之间的数据传输优化第47-48页
        4.2.2 CPU/MIC协同计算负载均衡优化第48-50页
        4.2.3 SIMD向量化第50-51页
    4.3 性能测试第51-56页
        4.3.1 CPU与MIC的负载均衡效果及分析第52-53页
        4.3.2 HYB-OPT最终版本的效果及分析第53-54页
        4.3.3 天河二号大规模可扩展性测试第54-55页
        4.3.4 OpenMP 4.0与Intel'sLEO版本性能对比第55-56页
    4.4 本章小结第56-57页
第五章 总结与展望第57-59页
    5.1 工作总结第57-58页
    5.2 工作展望第58-59页
致谢第59-61页
参考文献第61-65页
作者在学期间取得的学术成果第65-66页
附录第66-67页

论文共67页,点击 下载论文
上一篇:高性能全冗余十进制乘法器的研究与设计
下一篇:面向L1/L2缓存的NV-SRAM单元设计