摘要 | 第3-4页 |
ABSTRACT | 第4页 |
第1章 绪论 | 第8-14页 |
1.1 空间等离子体数值模拟的研究背景 | 第8-9页 |
1.2 异构计算平台的空间等离子体粒子模拟的研究意义 | 第9-12页 |
1.2.1 传统计算机集群的空间数值模拟 | 第9-10页 |
1.2.2 异构计算平台的发展 | 第10-12页 |
1.3 空间等离子体粒子模拟的国内外研究现状 | 第12页 |
1.4 本文的主要内容与结构安排 | 第12-14页 |
第2章 异构并行计算平台及其计算能力 | 第14-25页 |
2.1 并行计算概述 | 第14-15页 |
2.2 并行计算集群 | 第15-16页 |
2.3 CPU+GPU异构并行 | 第16-19页 |
2.4 CPU+MIC异构并行 | 第19-22页 |
2.4.1 MIC的结构与编程模式 | 第19-21页 |
2.4.2 MIC的offload模式向量化 | 第21-22页 |
2.5 CPU,GPU以及MIC的计算能力基准测试 | 第22-24页 |
2.5.1 HPL基准测试介绍 | 第22页 |
2.5.2 CPU,GPU,MIC三种平台的HPL测试计算能力 | 第22-24页 |
2.6 本章小结 | 第24-25页 |
第3章 空间数值模拟算法与实现 | 第25-33页 |
3.1 等离子体粒子模拟方法概述 | 第25-26页 |
3.2 等离子体粒子模拟算法基本原理 | 第26-28页 |
3.3 PIC模拟程序的基本结构 | 第28-31页 |
3.3.1 网格电场计算deposit | 第28-29页 |
3.3.2 粒子受力模拟push | 第29-30页 |
3.3.3 磁场计算field | 第30-31页 |
3.3.4 粒子更新位置reorder | 第31页 |
3.4 PIC的模拟结果 | 第31-32页 |
3.5 本章小结 | 第32-33页 |
第4章 基于异构平台的计算模拟及优化与结果分析 | 第33-51页 |
4.1 并行设计理论 | 第33-34页 |
4.2 空间等离子体粒子模拟的初步并行化 | 第34-38页 |
4.2.1 OpenMP并行 | 第34-35页 |
4.2.2 MPI并行 | 第35页 |
4.2.3 PIC的数据结构优化及初步并行 | 第35-38页 |
4.3 基于CPU+GPU异构平台的并行化 | 第38-42页 |
4.3.1 GPU的CUDA编程理论 | 第38-39页 |
4.3.2 基于CUDA的PIC异构模拟与优化 | 第39-42页 |
4.4 基于CPU+MIC异构平台的并行化 | 第42-44页 |
4.4.1 MIC的offload模式 | 第42-43页 |
4.4.2 基于MIC的PIC异构模拟与优化 | 第43-44页 |
4.5 PIC的异构并行计算对比 | 第44-50页 |
4.5.1 对比平台配置 | 第44-46页 |
4.5.2 MIC平台下不同线程并行化比较 | 第46-47页 |
4.5.3 不同网格大小的计算性能对比 | 第47-48页 |
4.5.4 不同函数的计算性能对比 | 第48-49页 |
4.5.5 计算性能与功耗对比 | 第49-50页 |
4.6 本章小结 | 第50-51页 |
第5章 空间模拟数据可视化平台 | 第51-55页 |
5.1 OpenGL可视化 | 第51-52页 |
5.2 可视化硬件平台 | 第52-53页 |
5.3 模拟数据的可视化 | 第53-54页 |
5.4 本章小结 | 第54-55页 |
第6章 总结与展望 | 第55-57页 |
6.1 论文工作总结 | 第55-56页 |
6.2 未来工作展望 | 第56-57页 |
致谢 | 第57-58页 |
参考文献 | 第58-61页 |
攻读学位期间的研究成果 | 第61页 |