基于异构计算的MOND数值模拟加速技术研究

摘要	第5-7页
ABSTRACT	第7-8页
主要符号对照表	第15-16页
第一章绪论	第16-22页
1.1 研究背景及意义	第16-17页
1.2 国内外研究现状	第17-19页
1.3 本文研究内容	第19-20页
1.4 论文组织安排	第20-22页
第二章相关背景介绍	第22-40页
2.1 修正牛顿动力学理论简介	第22-23页
2.2 N体问题典型算法	第23-28页
2.2.1 粒子-粒子算法	第24页
2.2.2 树形算法	第24-26页
2.2.3 网格算法	第26-27页
2.2.4 粒子-网格混合算法	第27页
2.2.5 树形-网格混合算法	第27-28页
2.3 计算加速技术	第28-36页
2.3.1 基于单指令多数据协处理器进行向量编程	第29-30页
2.3.2 利用多核系统	第30-32页
2.3.3 利用GPGPU/Xeon Phi等众核处理器	第32-34页
2.3.4 利用FPGA可重构加速器	第34-36页
2.3.5 定制的ASIC专用加速器	第36页
2.4 TreePM加速算法研究现状	第36-39页
2.5 本章小结	第39-40页
第三章 TreePM算法并行加速研究	第40-52页
3.1 TreePM串行算法分析	第40-45页
3.1.1 TreePM串行算法瓶颈分析	第40-43页
3.1.2 TreePM算法中的树形数据结构建立	第43页
3.1.3 TreePM算法中的引力势能计算	第43-45页
3.1.4 TreePM算法中的三维傅里叶变换运算	第45页
3.2 TreePM算法的并行加速方案	第45-49页
3.2.1 GPU加速树形数据结构的构造和相互作用列表的生成	第45-47页
3.2.2 FPGA加速粒子间相互作用势能的计算	第47-49页
3.2.3 FFT计算	第49页
3.3 本章小结	第49-52页
第四章基于异构平台的MOND模拟计算加速	第52-66页
4.1 基于TreePM算法的MOND理论数值模拟	第52-55页
4.2 单节点加速平台的架构	第55-62页
4.2.1 CPU上的软件设计	第55-56页
4.2.2 GPU上的软件设计	第56-57页
4.2.3 FPGA内部硬件架构	第57页
4.2.4 FPGA加速Tree运算的设计和优化	第57-60页
4.2.5 FPGA加速PM运算的设计和优化	第60-61页
4.2.6 Tree模块和PM模块的动态可重构	第61-62页
4.3 多节点加速平台的架构	第62-64页
4.4 本章小结	第64-66页
第五章系统验证测试研究	第66-78页
5.1 实验环境介绍	第66-68页
5.1.1 硬件参数	第66-68页
5.1.2 开发工具	第68页
5.1.3 测试数据	第68页
5.1.4 对照软件	第68页
5.2 仿真结果的正确性	第68-70页
5.3 单节点异构计算平台	第70-74页
5.3.1 性能对比	第70-72页
5.3.2 能耗对比	第72-74页
5.4 多节点异构计算平台	第74-76页
5.5 本章小结	第76-78页
第六章总结与展望	第78-80页
6.1 研究工作总结	第78-79页
6.2 下一步工作展望	第79-80页
参考文献	第80-84页
致谢	第84-86页
在读期间发表的学术论文与取得的研究成果	第86页