摘要 | 第5-7页 |
ABSTRACT | 第7-8页 |
主要符号对照表 | 第15-16页 |
第一章 绪论 | 第16-22页 |
1.1 研究背景及意义 | 第16-17页 |
1.2 国内外研究现状 | 第17-19页 |
1.3 本文研究内容 | 第19-20页 |
1.4 论文组织安排 | 第20-22页 |
第二章 相关背景介绍 | 第22-40页 |
2.1 修正牛顿动力学理论简介 | 第22-23页 |
2.2 N体问题典型算法 | 第23-28页 |
2.2.1 粒子-粒子算法 | 第24页 |
2.2.2 树形算法 | 第24-26页 |
2.2.3 网格算法 | 第26-27页 |
2.2.4 粒子-网格混合算法 | 第27页 |
2.2.5 树形-网格混合算法 | 第27-28页 |
2.3 计算加速技术 | 第28-36页 |
2.3.1 基于单指令多数据协处理器进行向量编程 | 第29-30页 |
2.3.2 利用多核系统 | 第30-32页 |
2.3.3 利用GPGPU/Xeon Phi等众核处理器 | 第32-34页 |
2.3.4 利用FPGA可重构加速器 | 第34-36页 |
2.3.5 定制的ASIC专用加速器 | 第36页 |
2.4 TreePM加速算法研究现状 | 第36-39页 |
2.5 本章小结 | 第39-40页 |
第三章 TreePM算法并行加速研究 | 第40-52页 |
3.1 TreePM串行算法分析 | 第40-45页 |
3.1.1 TreePM串行算法瓶颈分析 | 第40-43页 |
3.1.2 TreePM算法中的树形数据结构建立 | 第43页 |
3.1.3 TreePM算法中的引力势能计算 | 第43-45页 |
3.1.4 TreePM算法中的三维傅里叶变换运算 | 第45页 |
3.2 TreePM算法的并行加速方案 | 第45-49页 |
3.2.1 GPU加速树形数据结构的构造和相互作用列表的生成 | 第45-47页 |
3.2.2 FPGA加速粒子间相互作用势能的计算 | 第47-49页 |
3.2.3 FFT计算 | 第49页 |
3.3 本章小结 | 第49-52页 |
第四章 基于异构平台的MOND模拟计算加速 | 第52-66页 |
4.1 基于TreePM算法的MOND理论数值模拟 | 第52-55页 |
4.2 单节点加速平台的架构 | 第55-62页 |
4.2.1 CPU上的软件设计 | 第55-56页 |
4.2.2 GPU上的软件设计 | 第56-57页 |
4.2.3 FPGA内部硬件架构 | 第57页 |
4.2.4 FPGA加速Tree运算的设计和优化 | 第57-60页 |
4.2.5 FPGA加速PM运算的设计和优化 | 第60-61页 |
4.2.6 Tree模块和PM模块的动态可重构 | 第61-62页 |
4.3 多节点加速平台的架构 | 第62-64页 |
4.4 本章小结 | 第64-66页 |
第五章 系统验证测试研究 | 第66-78页 |
5.1 实验环境介绍 | 第66-68页 |
5.1.1 硬件参数 | 第66-68页 |
5.1.2 开发工具 | 第68页 |
5.1.3 测试数据 | 第68页 |
5.1.4 对照软件 | 第68页 |
5.2 仿真结果的正确性 | 第68-70页 |
5.3 单节点异构计算平台 | 第70-74页 |
5.3.1 性能对比 | 第70-72页 |
5.3.2 能耗对比 | 第72-74页 |
5.4 多节点异构计算平台 | 第74-76页 |
5.5 本章小结 | 第76-78页 |
第六章 总结与展望 | 第78-80页 |
6.1 研究工作总结 | 第78-79页 |
6.2 下一步工作展望 | 第79-80页 |
参考文献 | 第80-84页 |
致谢 | 第84-86页 |
在读期间发表的学术论文与取得的研究成果 | 第86页 |