GPU-CPU混合架构下燃烧室辐射换热求解器的设计与实现

摘要	第4-5页
Abstract	第5页
1 绪论	第8-15页
1.1 课题研究背景以及意义	第8-9页
1.2 国内外研究现状	第9-13页
1.3 论文结构安排	第13-14页
1.4 本文的主要工作	第14-15页
2 辐射传热模型相关研究	第15-28页
2.1 辐射换热数值模拟模型	第15-20页
2.1.1 辐射传输方程	第15-17页
2.1.2 辐射换热蒙特卡洛方法	第17-20页
2.2 CUDA编程架构	第20-27页
2.2.1 GPU与CUDA	第20-23页
2.2.2 CUDA硬件连接	第23-24页
2.2.3 CUDA编程模型	第24-25页
2.2.4 CUDA存储器模型	第25-27页
2.3 消息传递接口（MPI）	第27-28页
3 辐射换热模拟程序技术路线及总体设计	第28-35页
3.1 开发平台	第28-29页
3.2 技术路线	第29-32页
3.2.1 能束传输	第30-31页
3.2.2 热辐射蒙特卡罗算法	第31页
3.2.3 GPU/CPU架构下的任务分配负载平衡	第31-32页
3.2.4 GPU/CPU异构计算集群的构建及管理	第32页
3.3 技术指标	第32页
3.4 总体设计	第32-34页
3.5 小结	第34-35页
4 辐射换热数值模拟的实现	第35-60页
4.1 开发环境	第35页
4.2 网格文件及输入文件格式	第35-36页
4.3 单能束射线的追踪	第36-44页
4.3.1 射线追踪算法	第37-41页
4.3.2 射线到达计算边界的处理	第41-43页
4.3.3 SNBCK模型	第43-44页
4.4 GPU上的随机数发生器	第44-45页
4.5 能束在GPU/CPU异构下的动态负载平衡模式	第45-50页
4.5.1 任务分配策略	第46页
4.5.2 GPU程序优化策略	第46-50页
4.6 计算集群的软件部署	第50-59页
4.6.1 I/O节点的配置	第52-54页
4.6.2 网络节点配置	第54-55页
4.6.3 计算（管理）节点的系统模版	第55-59页
4.6.4 配置新计算节点	第59页
4.7 小结	第59-60页
5 测试	第60-67页
5.1 圆柱炉膛壁辐射换热特性模拟	第60-61页
5.2 分支优化和访存优化对比测试	第61-62页
5.3 并行加速测速	第62-63页
5.4 GPU/CPU混合加速测试	第63-65页
5.4.1 单GPU加速效果	第63-64页
5.4.2 GPU/CPU混合计算加速效果	第64-65页
5.5 PBS排队系统测试	第65-66页
5.6 小结	第66-67页
6 总结与展望	第67-68页
致谢	第68-69页
参考文献	第69-74页
附录A 开发环境及程序结构	第74-75页
网格的数据结构	第74-75页
CK模型的数据结构	第75页