摘要 | 第3-5页 |
ABSTRACT | 第5-6页 |
第一章 绪论 | 第10-15页 |
1.1 研究背景 | 第10-13页 |
1.1.1 数值天气预报发展概况 | 第10-11页 |
1.1.2 国内外高性能计算系统发展概况 | 第11-13页 |
1.2 课题来源及目的 | 第13-14页 |
1.3 本文主要研究内容 | 第14-15页 |
第二章 消息传递接口及实验平台综述 | 第15-21页 |
2.1 消息传递编程规范 | 第15-17页 |
2.1.1 消息传递编程模型 | 第15-16页 |
2.1.2 MPI的产生 | 第16页 |
2.1.3 MPI的实现 | 第16-17页 |
2.2 MPI并行环境构建 | 第17-19页 |
2.2.1 本课题采用的MPI实现 | 第17-18页 |
2.2.2 配置MPICH实验环境 | 第18-19页 |
2.3 硬件环境介绍 | 第19-20页 |
2.4 本章小结 | 第20-21页 |
第三章 程序结构及性能分析 | 第21-26页 |
3.1 GRAPES程序结构 | 第21-23页 |
3.2 GRAPES并行区域分解方案 | 第23-24页 |
3.3 程序性能数据获取及分析 | 第24-25页 |
3.3.1 获取程序性能数据 | 第24页 |
3.3.2 性能数据分析 | 第24-25页 |
3.4 本章小结 | 第25-26页 |
第四章 GRAPES模式I/O及初始化优化 | 第26-35页 |
4.1 GRAPES_INPUT子程序优化方案设计与实现 | 第26-30页 |
4.1.1 grapes_input子程序结构分析 | 第26-28页 |
4.1.2 grapes_input子程序优化方案设计 | 第28-30页 |
4.2 COLM_INIT子程序优化方案设计与实现 | 第30-32页 |
4.2.1 colm_init子程序结构分析 | 第30-31页 |
4.2.2 colm_init子程序优化方案设计 | 第31-32页 |
4.3 模式输出子程序优化方案设计与实现 | 第32-34页 |
4.3.1 模式输出子程序结构分析 | 第32-33页 |
4.3.2 模式输出子程序优化方案设计 | 第33-34页 |
4.4 本章小结 | 第34-35页 |
第五章 GRAPES异构并行算法研究 | 第35-46页 |
5.1 众核并行编程模型介绍 | 第35-36页 |
5.2 GRAPES多级混合并行编程方案设计 | 第36-38页 |
5.3 众核并行编程优化策略 | 第38-39页 |
5.3.1 数据布局优化 | 第38页 |
5.3.2 计算与DMA通信相互隐藏 | 第38-39页 |
5.3.3 离散数组内存调整 | 第39页 |
5.4 众核并行编程的实现 | 第39-44页 |
5.4.1 众核并行编程方法 | 第39-43页 |
5.4.2 使用Open Acc进行众核编程 | 第43-44页 |
5.5 本章小结 | 第44-46页 |
第六章 实验结果与性能分析 | 第46-57页 |
6.1 模式I/O及初始化优化结果及分析 | 第46-49页 |
6.1.1 grapes_input子程序优化结果 | 第46-47页 |
6.1.2 colm_init子程序优化结果 | 第47-48页 |
6.1.3 模式输出子程序优化结果 | 第48-49页 |
6.2 模式积分迭代过程优化结果及分析 | 第49-52页 |
6.3 预报结果验证 | 第52-56页 |
6.4 本章小结 | 第56-57页 |
第七章 总结与展望 | 第57-59页 |
7.1 全文工作总结 | 第57页 |
7.2 进一步研究的展望 | 第57-59页 |
参考文献 | 第59-62页 |
致谢 | 第62-63页 |
攻读学位期间发表的学术论文 | 第63-65页 |