基于GPU的粒子模拟并行方法研究

摘要	第5-6页
ABSTRACT	第6页
第一章绪论	第9-17页
1.1 电磁粒子模拟概述	第9-10页
1.2 GPU概述	第10-14页
1.2.1 GPU通用计算的发展	第12页
1.2.2 GPU计算的软硬件构架简介	第12-14页
1.3 论文立题背景及主要工作	第14-16页
1.4 论文的主要安排	第16-17页
第二章基于Fortran的GPU并行程序设计	第17-33页
2.1 OpenACC简介	第17-20页
2.1.1 OpenACC构件	第17-19页
2.1.2 OpenACC执行模型	第19-20页
2.2 CUDA概述	第20-26页
2.2.1 CUDA编译过程及相关工具	第20-22页
2.2.2 CUDA编程模型	第22-25页
2.2.3 PGI编译器与CUDA Fortran	第25-26页
2.3 Intel编译器与PGI编译器代码移植	第26-27页
2.4 GPU应用程序实现及优化	第27-28页
2.5 矩阵乘法测试与加速性能对比	第28-32页
2.6 小结	第32-33页
第三章基于GPU的电磁模拟并行计算	第33-46页
3.1 FDTD算法基础	第33-35页
3.2 FDTD的GPU并行化实现	第35-39页
3.2.1 电场迭代部分	第36-37页
3.2.2 磁场迭代部分	第37页
3.2.3 实际器件的模拟结论与分析	第37-39页
3.3 对于GPU并行计算的改进	第39-45页
3.3.1 电场迭代部分的修改	第40-41页
3.3.2 磁场迭代部分的修改	第41-42页
3.3.3 改进后的运算结果	第42-45页
3.4 小结	第45-46页
第四章基于GPU的粒子模拟并行计算	第46-53页
4.1 EM-PIC算法基础	第46-49页
4.1.1 EM-PIC算法优化	第47-48页
4.1.2 EM-PIC算法的GPU模型	第48-49页
4.2 GPU运算结果	第49-51页
4.3 解决方案	第51-52页
4.4 小结	第52-53页
第五章总结	第53-54页
致谢	第54-55页
参考文献	第55-57页
附录	第57-65页
GPU实现矩阵乘法主程序	第57-60页
使用OpenACC的优化函数与串行函数	第60-61页
CUDA并行部分的函数	第61-65页