基于GPU集群的PIC方法并行加速研究

摘要	第3-4页
ABSTRACT	第4页
目录	第5-8页
图录	第8-9页
第一章绪论	第9-23页
1.1 物理背景	第9-19页
1.1.1 核聚变传统点火方式	第9页
1.1.2 快点火方式	第9-12页
1.1.3 粒子模拟方法	第12-19页
1.2 并行计算在科学计算中的应用	第19-20页
1.3 目前存在的问题	第20-21页
1.4 研究内容及工作	第21页
1.5 论文内容	第21-23页
第二章相关理论技术	第23-31页
2.1 并行计算发展	第23-24页
2.2 GPGPU	第24页
2.3 CUDA架构	第24-27页
2.3.1 统一计算设备架构CUDA	第24-26页
2.3.2 新一代Kepler架构	第26-27页
2.4 超级计算机	第27-29页
2.4.1 超级计算机发展	第27-28页
2.4.2 超级计算机π	第28-29页
2.5 本章小结	第29-31页
第三章 PIC程序分析	第31-41页
3.1 PIC程序介绍	第31-35页
3.1.1 环境变量	第32-33页
3.1.2 主循环	第33页
3.1.3 碰撞函数coulomb_collision	第33页
3.1.4 转移函数Mover	第33-34页
3.1.5 电场函数Fields	第34页
3.1.6 调整函数Diagnosis	第34-35页
3.2 程序剖析	第35-38页
3.2.1 剖析工具	第35-38页
3.3 剖析结果分析	第38-40页
3.4 本章小结	第40-41页
第四章程序并行加速	第41-57页
4.1 负载均衡	第41-43页
4.1.1 负载平衡的评价指标	第41页
4.1.2 负载均衡和加速比	第41-42页
4.1.3 Amdahl 定律	第42-43页
4.1.4 优化策略	第43页
4.2 热点函数并行化	第43-50页
4.2.1 coulomb_collision函数并行化	第44-48页
4.2.2 Mover函数并行化	第48-50页
4.3 优化数据传输	第50-55页
4.3.1 数据传输现状	第50-52页
4.3.2 Diagnosis函数迁移	第52-53页
4.3.3 Fields_origin函数迁移	第53-55页
4.4 本章小结	第55-57页
第五章实验结果及分析	第57-61页
5.1 实验平台介绍	第57页
5.2 正确性分析	第57-58页
5.3 性能分析	第58-60页
5.4 本章小结	第60-61页
第六章结束语	第61-65页
6.1 论文主要工作	第61-63页
6.1.1 PIC串行程序分析	第61-62页
6.1.2 并行及调优工作	第62页
6.1.3 实验数据	第62-63页
6.2 未来工作展望	第63-65页
6.2.1 进一步优化	第63页
6.2.2 针对平台的优化	第63-65页
参考文献	第65-69页
致谢	第69-71页
攻读硕士学位期间已发表或录用的论文	第71-73页