首页--天文学、地球科学论文--天文学论文--恒星天文学、星系天文学、宇宙学论文--宇宙学论文

基于异构计算的MOND数值模拟加速技术研究

摘要第5-7页
ABSTRACT第7-8页
主要符号对照表第15-16页
第一章 绪论第16-22页
    1.1 研究背景及意义第16-17页
    1.2 国内外研究现状第17-19页
    1.3 本文研究内容第19-20页
    1.4 论文组织安排第20-22页
第二章 相关背景介绍第22-40页
    2.1 修正牛顿动力学理论简介第22-23页
    2.2 N体问题典型算法第23-28页
        2.2.1 粒子-粒子算法第24页
        2.2.2 树形算法第24-26页
        2.2.3 网格算法第26-27页
        2.2.4 粒子-网格混合算法第27页
        2.2.5 树形-网格混合算法第27-28页
    2.3 计算加速技术第28-36页
        2.3.1 基于单指令多数据协处理器进行向量编程第29-30页
        2.3.2 利用多核系统第30-32页
        2.3.3 利用GPGPU/Xeon Phi等众核处理器第32-34页
        2.3.4 利用FPGA可重构加速器第34-36页
        2.3.5 定制的ASIC专用加速器第36页
    2.4 TreePM加速算法研究现状第36-39页
    2.5 本章小结第39-40页
第三章 TreePM算法并行加速研究第40-52页
    3.1 TreePM串行算法分析第40-45页
        3.1.1 TreePM串行算法瓶颈分析第40-43页
        3.1.2 TreePM算法中的树形数据结构建立第43页
        3.1.3 TreePM算法中的引力势能计算第43-45页
        3.1.4 TreePM算法中的三维傅里叶变换运算第45页
    3.2 TreePM算法的并行加速方案第45-49页
        3.2.1 GPU加速树形数据结构的构造和相互作用列表的生成第45-47页
        3.2.2 FPGA加速粒子间相互作用势能的计算第47-49页
        3.2.3 FFT计算第49页
    3.3 本章小结第49-52页
第四章 基于异构平台的MOND模拟计算加速第52-66页
    4.1 基于TreePM算法的MOND理论数值模拟第52-55页
    4.2 单节点加速平台的架构第55-62页
        4.2.1 CPU上的软件设计第55-56页
        4.2.2 GPU上的软件设计第56-57页
        4.2.3 FPGA内部硬件架构第57页
        4.2.4 FPGA加速Tree运算的设计和优化第57-60页
        4.2.5 FPGA加速PM运算的设计和优化第60-61页
        4.2.6 Tree模块和PM模块的动态可重构第61-62页
    4.3 多节点加速平台的架构第62-64页
    4.4 本章小结第64-66页
第五章 系统验证测试研究第66-78页
    5.1 实验环境介绍第66-68页
        5.1.1 硬件参数第66-68页
        5.1.2 开发工具第68页
        5.1.3 测试数据第68页
        5.1.4 对照软件第68页
    5.2 仿真结果的正确性第68-70页
    5.3 单节点异构计算平台第70-74页
        5.3.1 性能对比第70-72页
        5.3.2 能耗对比第72-74页
    5.4 多节点异构计算平台第74-76页
    5.5 本章小结第76-78页
第六章 总结与展望第78-80页
    6.1 研究工作总结第78-79页
    6.2 下一步工作展望第79-80页
参考文献第80-84页
致谢第84-86页
在读期间发表的学术论文与取得的研究成果第86页

论文共86页,点击 下载论文
上一篇:面向概念漂移问题的选择性适应集成学习方法研究
下一篇:细微运动的视觉增强及硬件加速技术研究