真空电子器件二维粒子模拟GPU加速模拟研究

摘要	第5-6页
ABSTRACT	第6-7页
第一章绪论	第10-15页
1.1 论文的选题背景和意义	第10-12页
1.2 GPU和CPU的对比	第12-13页
1.3 本文的主要工作与创新	第13页
1.4 论文的组织结构	第13-15页
第二章 GPU体系架构与CUDA概述	第15-25页
2.1 GPU架构	第15-19页
2.1.1 基于Maxwell的GM204架构	第15-17页
2.1.2 kernel函数的硬件映射	第17-18页
2.1.3 GPU的存储模型	第18-19页
2.2 CUDA概述	第19-24页
2.2.1 CUDA编程模型	第19-21页
2.2.2 CUDA C/C++语言的扩展	第21-22页
2.2.3 ParallelNsight性能分析工具	第22-24页
2.3 本章小结	第24-25页
第三章基于二维直角坐标系的PIC算法及其GPU并行	第25-49页
3.1 引言	第25-26页
3.2 电流密度的求解	第26-34页
3.2.1 网格所属电流密度的公式推导	第26-33页
3.2.2 电流密度求解的串行代码的实现	第33-34页
3.3 电磁场的求解	第34-37页
3.3.1 网格所属电磁场的公式推导	第34-37页
3.3.2 电磁场求解的串行代码的实现	第37页
3.4 速度位置的求解	第37-43页
3.4.1 粒子所在位置的作用场的公式推导	第37-39页
3.4.2 粒子的速度位置的公式推导	第39-43页
3.4.3 粒子速度位置求解的串行代码的实现	第43页
3.5 二维直角坐标系PIC算法实现的流程图	第43-44页
3.6 二维直角坐标系PIC算法的GPU并行实现	第44-48页
3.6.1 电磁场求解的GPU并行代码的实现	第46-47页
3.6.2 粒子速度位置求解的GPU并行代码的实现	第47页
3.6.3 电流密度求解的GPU并行代码的实现	第47-48页
3.7 本章小结	第48-49页
第四章模型建立与结果分析	第49-70页
4.1 引言	第49页
4.2 串行实现部分	第49-61页
4.2.1 矩形结构模型	第49-57页
4.2.2 速调管结构模型	第57-61页
4.3 并行实现部分	第61-68页
4.3.1 串并行结果对比	第61-64页
4.3.2 GPU并行加速比	第64-68页
4.4 误差分析	第68页
4.5 本章小结	第68-70页
第五章总结与展望	第70-71页
致谢	第71-72页
参考文献	第72-73页