多区结构网格CFD典型求解器的CPU/GPU并行计算研究

目录	第1-6页
表目录	第6-7页
图目录	第7-9页
摘要	第9-10页
ABSTRACT	第10-11页
第一章绪论	第11-19页
·研究背景	第11-13页
·计算流体力学简介	第11-12页
·CFD 基本流程和并行需求分析	第12-13页
·CFD 应用的 GPU 并行研究现状	第13-15页
·国内研究现状	第13-14页
·国外研究现状	第14-15页
·简要分析总结	第15页
·研究内容	第15-16页
·论文结构	第16-19页
第二章 GPU 体系结构与编程	第19-27页
·GPU 体系结构特点	第19-22页
·GPU 编程开发环境	第22-24页
·“天河-1A”系统介绍	第24-25页
·本章小结	第25-27页
第三章 CFD 典型求解器的 GPU 并行计算研究	第27-51页
·空间离散和时间离散	第27-30页
·空间离散格式	第27-29页
·时间离散格式	第29-30页
·CFD 典型求解器分析	第30-36页
·显式龙格-库塔求解方法	第30-32页
·隐式 LU-SGS 求解方法	第32-34页
·隐式雅可比迭代求解方法	第34-36页
·CFD 典型计算过程的 GPU 并行	第36-41页
·求解器中典型的计算过程	第36-38页
·数据独立型计算的 GPU 并行	第38页
·弱数据依赖型计算的 GPU 并行	第38-40页
·强数据依赖型和分支密集型计算的 GPU 并行	第40-41页
·GPU 并行性能优化方法	第41-45页
·数据结构的改造	第41-43页
·GPU 存储层次的并行优化	第43-44页
·CPU/GPU 数据通信优化	第44-45页
·GPU 上线程块配置	第45页
·GPU 并行性能分析	第45-48页
·典型计算过程计算性能	第45-47页
·显式龙格-库塔求解器整体计算性能	第47页
·隐式雅可比迭代求解器整体计算性能	第47-48页
·本章小结	第48-51页
第四章 CPU/GPU 的协同并行计算研究	第51-63页
·多核 CPU 并行计算	第51-53页
·CPU 上的并行粒度	第51-52页
·多核 CPU 并行性能	第52-53页
·CPU/GPU 协同并行编程模型	第53-56页
·基于线程嵌套的协同并行编程模型	第54-55页
·基于 GPU 异步通信的协同并行编程模型	第55-56页
·求解器协同并行方式	第56-59页
·CPU/GPU 采用相同求解器的协同并行	第56-58页
·CPU/GPU 采用不同求解器的协同并行	第58-59页
·CPU/GPU 的负载平衡	第59-60页
·协同并行计算的性能分析	第60-61页
·雅可比迭代求解器的协同并行性能分析	第60-61页
·混合迭代求解器的协同并行性能分析	第61页
·本章小结	第61-63页
第五章总结与展望	第63-65页
致谢	第65-67页
参考文献	第67-71页
作者在学期间取得的学术成果	第71-73页
附录	第73-74页