首页--天文学、地球科学论文--大气科学(气象学)论文--一般理论与方法论文--电子计算机在大气科学上的应用论文

基于GPGPU系统的GRAPES-GLOBAL长波辐射过程并行设计与优化

摘要第1-5页
Abstract第5-9页
第一章 引言第9-17页
   ·选题的目的和意义第9-13页
     ·GRAPES数值预报模式第9-10页
     ·GPGPU 和 CUDA 简介第10-11页
     ·GPGPU 系统架构介绍及将其运用于 GRAPES 模式的可行性分析第11-13页
   ·基于 GPGPU 系统通用计算的国内外研究进展第13-14页
   ·本文研究内容和创新点第14-16页
     ·本文研究内容第14-15页
     ·本文研究的创新点第15-16页
   ·论文的结构第16-17页
第二章 CUDA 编程模型和存储器模型第17-23页
   ·CUDA 编程模型第17-20页
     ·主机与设备第17-18页
     ·线程组织结构第18-19页
     ·Warp第19-20页
     ·SIMT 编程模型第20页
   ·CUDA 存储器模型第20-22页
     ·寄存器与本地存储器第20-21页
     ·共享存储器第21页
     ·全局存储器第21-22页
     ·常数存储器和纹理存储器第22页
   ·本章小结第22-23页
第三章 长波辐射方案及细粒度并行模型第23-34页
   ·GRAPES 全球模式中的长波辐射物理模型第23-24页
   ·GRAPES 模式的并行框架分析第24-25页
   ·基于 GPGPU 系统的 GRAPES 模式并行框架分析第25-27页
   ·长波辐射方案的细粒度并行模型第27-30页
   ·CUDA FORTRAN 程序实现第30-33页
     ·CUDA FORTRAN 介绍第30-31页
     ·基于 GPGPU 系统的长波辐射方案程序实现第31-33页
   ·本章小结第33-34页
第四章 初期试验结果分析第34-43页
   ·Tesla C1060 试验第34-39页
     ·试验环境和参数第34页
     ·试验结果分析第34-37页
     ·试验结果验证第37-39页
   ·Tesla C2050 试验第39-42页
     ·试验环境和参数第39页
     ·试验结果分析第39-40页
     ·单个 block 内线程数量变化对性能的影响第40-42页
   ·本章小结第42-43页
第五章 CUDA 程序优化第43-53页
   ·CUDA 程序优化概述第43-44页
   ·本试验中的 CUDA 程序分析第44-45页
   ·Pinned memory第45-46页
   ·异步执行第46-48页
   ·异步执行程序演示第48-49页
   ·数据流异步执行模型第49-50页
   ·试验结果及分析第50-52页
   ·本章小结第52-53页
第六章 总结与讨论第53-58页
   ·总结第53-54页
   ·讨论第54-58页
参考文献第58-60页
致谢第60-61页
个人简介第61页

论文共61页,点击 下载论文
上一篇:2010年6月19日华南西部一次飑线过程的观测研究
下一篇:在GRAPES模式中引入夹卷过程的影响试验