首页--数理科学和化学论文--分子物理学、原子物理学论文--分子物理学论文

基于AMD平台的OpenCL优化研究及其在分子动力学中的应用

摘要第4-5页
ABSTRACT第5-6页
缩略词第12-14页
第一章 绪论第14-18页
    1.0 研究背景第14-15页
    1.1 研究现状第15-16页
    1.2 本文的主要内容和贡献第16-17页
    1.3 论文组织结构第17-18页
第二章 Open CL优化研究与分子动力学理论基础第18-49页
    2.1 GPU与异构计算简介第18-23页
        2.1.1 GPU发展过程第18-20页
        2.1.2 AMD典型架构解析第20-23页
    2.2 Open CL第23-28页
        2.2.1 Open CL平台模型第23页
        2.2.2 Open CL执行模型第23-25页
        2.2.3 Open CL内存模型第25-26页
        2.2.4 Open CL编程模型第26-27页
        2.2.5 Open CL编程及执行过程第27-28页
    2.3 并行优化理论依据第28页
    2.4 内存优化第28-39页
        2.4.1 平台传输性能测试第29-30页
        2.4.2 主机端内存分配优化第30-35页
        2.4.3 全局内存访问优化第35-37页
        2.4.4 本地内存访问优化第37-39页
    2.5 内核优化第39-41页
    2.6 其他部分的优化第41-42页
    2.7 分子动力学概述第42-43页
    2.8 分子动力学基础理论第43-46页
        2.8.1 原始模型第43-44页
        2.8.2 真实模型第44-46页
    2.9 分子动力学加速理论依据第46-47页
        2.9.1 周期性边界条件第46页
        2.9.2 元胞列表法第46-47页
        2.9.3 网格搜索法第47页
    2.10 LAMMPS软件简介第47-48页
    2.11 本章小结第48-49页
第三章 基于Open CL的GPU基数排序算法实现第49-63页
    3.1 基数排序算法介绍第49页
    3.2 并行排序思想第49-50页
    3.3 单GPU上实现过程第50-56页
        3.3.1 统计基数出现情况第50-51页
        3.3.2 偏移量计算第51-55页
        3.3.3 重排序第55-56页
    3.4 双GPU负载均衡第56-61页
    3.5 测试结果第61-62页
    3.6 本章小结第62-63页
第四章 LAMMPS短程力算法优化第63-81页
    4.1 测试平台第63页
    4.2 实验环境配置第63-65页
    4.3 LAMMPS程序解析第65-68页
        4.3.1 过程解析第65-67页
        4.3.2 GPU加速库结构解析第67-68页
    4.4 优化思路及步骤第68-69页
    4.5 宿主机端程序优化第69-70页
    4.6 邻接表算法优化第70-73页
        4.6.1 算法描述第70-72页
        4.6.2 内核优化工作第72-73页
    4.7 短程力计算优化第73-76页
        4.7.1 算法描述第73-74页
        4.7.2 内核优化工作第74-76页
    4.8 实验分析第76-80页
    4.9 本章小结第80-81页
第五章 总结和展望第81-83页
    5.1 总结第81页
    5.2 展望第81-83页
参考文献第83-87页
致谢第87-88页
在学期间的研究成果及发表的学术论文第88页

论文共88页,点击 下载论文
上一篇:4株海洋噬菌体的分离纯化及其生物学特性的研究
下一篇:基于格子Boltzmann方法的气液混合流体模拟