首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--其他计算机论文

基于国产高性能计算机的GRAPES性能优化研究

摘要第3-5页
ABSTRACT第5-6页
第一章 绪论第10-15页
    1.1 研究背景第10-13页
        1.1.1 数值天气预报发展概况第10-11页
        1.1.2 国内外高性能计算系统发展概况第11-13页
    1.2 课题来源及目的第13-14页
    1.3 本文主要研究内容第14-15页
第二章 消息传递接口及实验平台综述第15-21页
    2.1 消息传递编程规范第15-17页
        2.1.1 消息传递编程模型第15-16页
        2.1.2 MPI的产生第16页
        2.1.3 MPI的实现第16-17页
    2.2 MPI并行环境构建第17-19页
        2.2.1 本课题采用的MPI实现第17-18页
        2.2.2 配置MPICH实验环境第18-19页
    2.3 硬件环境介绍第19-20页
    2.4 本章小结第20-21页
第三章 程序结构及性能分析第21-26页
    3.1 GRAPES程序结构第21-23页
    3.2 GRAPES并行区域分解方案第23-24页
    3.3 程序性能数据获取及分析第24-25页
        3.3.1 获取程序性能数据第24页
        3.3.2 性能数据分析第24-25页
    3.4 本章小结第25-26页
第四章 GRAPES模式I/O及初始化优化第26-35页
    4.1 GRAPES_INPUT子程序优化方案设计与实现第26-30页
        4.1.1 grapes_input子程序结构分析第26-28页
        4.1.2 grapes_input子程序优化方案设计第28-30页
    4.2 COLM_INIT子程序优化方案设计与实现第30-32页
        4.2.1 colm_init子程序结构分析第30-31页
        4.2.2 colm_init子程序优化方案设计第31-32页
    4.3 模式输出子程序优化方案设计与实现第32-34页
        4.3.1 模式输出子程序结构分析第32-33页
        4.3.2 模式输出子程序优化方案设计第33-34页
    4.4 本章小结第34-35页
第五章 GRAPES异构并行算法研究第35-46页
    5.1 众核并行编程模型介绍第35-36页
    5.2 GRAPES多级混合并行编程方案设计第36-38页
    5.3 众核并行编程优化策略第38-39页
        5.3.1 数据布局优化第38页
        5.3.2 计算与DMA通信相互隐藏第38-39页
        5.3.3 离散数组内存调整第39页
    5.4 众核并行编程的实现第39-44页
        5.4.1 众核并行编程方法第39-43页
        5.4.2 使用Open Acc进行众核编程第43-44页
    5.5 本章小结第44-46页
第六章 实验结果与性能分析第46-57页
    6.1 模式I/O及初始化优化结果及分析第46-49页
        6.1.1 grapes_input子程序优化结果第46-47页
        6.1.2 colm_init子程序优化结果第47-48页
        6.1.3 模式输出子程序优化结果第48-49页
    6.2 模式积分迭代过程优化结果及分析第49-52页
    6.3 预报结果验证第52-56页
    6.4 本章小结第56-57页
第七章 总结与展望第57-59页
    7.1 全文工作总结第57页
    7.2 进一步研究的展望第57-59页
参考文献第59-62页
致谢第62-63页
攻读学位期间发表的学术论文第63-65页

论文共65页,点击 下载论文
上一篇:镇级党委党员信息管理系统的设计与实现--以寿光市营里镇为例
下一篇:在读师范生的公民观研究--基于南通大学的调查分析