基于AMD平台的OpenCL优化研究及其在分子动力学中的应用

摘要	第4-5页
ABSTRACT	第5-6页
缩略词	第12-14页
第一章绪论	第14-18页
1.0 研究背景	第14-15页
1.1 研究现状	第15-16页
1.2 本文的主要内容和贡献	第16-17页
1.3 论文组织结构	第17-18页
第二章 Open CL优化研究与分子动力学理论基础	第18-49页
2.1 GPU与异构计算简介	第18-23页
2.1.1 GPU发展过程	第18-20页
2.1.2 AMD典型架构解析	第20-23页
2.2 Open CL	第23-28页
2.2.1 Open CL平台模型	第23页
2.2.2 Open CL执行模型	第23-25页
2.2.3 Open CL内存模型	第25-26页
2.2.4 Open CL编程模型	第26-27页
2.2.5 Open CL编程及执行过程	第27-28页
2.3 并行优化理论依据	第28页
2.4 内存优化	第28-39页
2.4.1 平台传输性能测试	第29-30页
2.4.2 主机端内存分配优化	第30-35页
2.4.3 全局内存访问优化	第35-37页
2.4.4 本地内存访问优化	第37-39页
2.5 内核优化	第39-41页
2.6 其他部分的优化	第41-42页
2.7 分子动力学概述	第42-43页
2.8 分子动力学基础理论	第43-46页
2.8.1 原始模型	第43-44页
2.8.2 真实模型	第44-46页
2.9 分子动力学加速理论依据	第46-47页
2.9.1 周期性边界条件	第46页
2.9.2 元胞列表法	第46-47页
2.9.3 网格搜索法	第47页
2.10 LAMMPS软件简介	第47-48页
2.11 本章小结	第48-49页
第三章基于Open CL的GPU基数排序算法实现	第49-63页
3.1 基数排序算法介绍	第49页
3.2 并行排序思想	第49-50页
3.3 单GPU上实现过程	第50-56页
3.3.1 统计基数出现情况	第50-51页
3.3.2 偏移量计算	第51-55页
3.3.3 重排序	第55-56页
3.4 双GPU负载均衡	第56-61页
3.5 测试结果	第61-62页
3.6 本章小结	第62-63页
第四章 LAMMPS短程力算法优化	第63-81页
4.1 测试平台	第63页
4.2 实验环境配置	第63-65页
4.3 LAMMPS程序解析	第65-68页
4.3.1 过程解析	第65-67页
4.3.2 GPU加速库结构解析	第67-68页
4.4 优化思路及步骤	第68-69页
4.5 宿主机端程序优化	第69-70页
4.6 邻接表算法优化	第70-73页
4.6.1 算法描述	第70-72页
4.6.2 内核优化工作	第72-73页
4.7 短程力计算优化	第73-76页
4.7.1 算法描述	第73-74页
4.7.2 内核优化工作	第74-76页
4.8 实验分析	第76-80页
4.9 本章小结	第80-81页
第五章总结和展望	第81-83页
5.1 总结	第81页
5.2 展望	第81-83页
参考文献	第83-87页
致谢	第87-88页
在学期间的研究成果及发表的学术论文	第88页