首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

多区结构网格CFD典型求解器的CPU/GPU并行计算研究

目录第1-6页
表目录第6-7页
图目录第7-9页
摘要第9-10页
ABSTRACT第10-11页
第一章 绪论第11-19页
   ·研究背景第11-13页
     ·计算流体力学简介第11-12页
     ·CFD 基本流程和并行需求分析第12-13页
   ·CFD 应用的 GPU 并行研究现状第13-15页
     ·国内研究现状第13-14页
     ·国外研究现状第14-15页
     ·简要分析总结第15页
   ·研究内容第15-16页
   ·论文结构第16-19页
第二章 GPU 体系结构与编程第19-27页
   ·GPU 体系结构特点第19-22页
   ·GPU 编程开发环境第22-24页
   ·“天河-1A”系统介绍第24-25页
   ·本章小结第25-27页
第三章 CFD 典型求解器的 GPU 并行计算研究第27-51页
   ·空间离散和时间离散第27-30页
     ·空间离散格式第27-29页
     ·时间离散格式第29-30页
   ·CFD 典型求解器分析第30-36页
     ·显式龙格-库塔求解方法第30-32页
     ·隐式 LU-SGS 求解方法第32-34页
     ·隐式雅可比迭代求解方法第34-36页
   ·CFD 典型计算过程的 GPU 并行第36-41页
     ·求解器中典型的计算过程第36-38页
     ·数据独立型计算的 GPU 并行第38页
     ·弱数据依赖型计算的 GPU 并行第38-40页
     ·强数据依赖型和分支密集型计算的 GPU 并行第40-41页
   ·GPU 并行性能优化方法第41-45页
     ·数据结构的改造第41-43页
     ·GPU 存储层次的并行优化第43-44页
     ·CPU/GPU 数据通信优化第44-45页
     ·GPU 上线程块配置第45页
   ·GPU 并行性能分析第45-48页
     ·典型计算过程计算性能第45-47页
     ·显式龙格-库塔求解器整体计算性能第47页
     ·隐式雅可比迭代求解器整体计算性能第47-48页
   ·本章小结第48-51页
第四章 CPU/GPU 的协同并行计算研究第51-63页
   ·多核 CPU 并行计算第51-53页
     ·CPU 上的并行粒度第51-52页
     ·多核 CPU 并行性能第52-53页
   ·CPU/GPU 协同并行编程模型第53-56页
     ·基于线程嵌套的协同并行编程模型第54-55页
     ·基于 GPU 异步通信的协同并行编程模型第55-56页
   ·求解器协同并行方式第56-59页
     ·CPU/GPU 采用相同求解器的协同并行第56-58页
     ·CPU/GPU 采用不同求解器的协同并行第58-59页
   ·CPU/GPU 的负载平衡第59-60页
   ·协同并行计算的性能分析第60-61页
     ·雅可比迭代求解器的协同并行性能分析第60-61页
     ·混合迭代求解器的协同并行性能分析第61页
   ·本章小结第61-63页
第五章 总结与展望第63-65页
致谢第65-67页
参考文献第67-71页
作者在学期间取得的学术成果第71-73页
附录第73-74页

论文共74页,点击 下载论文
上一篇:三维处理器中计算资源动态共享技术研究
下一篇:CPU/GPU异构集群并行计算模型研究