| 摘要 | 第8-10页 |
| ABSTRACT | 第10-11页 |
| 第一章 绪论 | 第12-21页 |
| 1.1 课题来源 | 第12页 |
| 1.2 背景知识 | 第12-17页 |
| 1.2.1 分子动力学模拟的研究历程和意义 | 第12-13页 |
| 1.2.2 分子动力学模拟的基本算法及流程分析 | 第13-15页 |
| 1.2.3 分子动力学模拟面临的挑战 | 第15-16页 |
| 1.2.4 天河2号超级计算机和Intel MIC众核处理器简介 | 第16-17页 |
| 1.3 相关工作 | 第17-19页 |
| 1.4 本文的主要工作及贡献 | 第19页 |
| 1.5 本文的组织结构 | 第19-21页 |
| 第二章 基于单MIC的AMBER并行化研究 | 第21-33页 |
| 2.1 AMBER的程序结构及程序热点分析 | 第21-24页 |
| 2.1.1 AMBER-sander的程序结构 | 第21-23页 |
| 2.1.2 AMBER程序的热点分析 | 第23-24页 |
| 2.2 sander程序的OpenMP并行化 | 第24-26页 |
| 2.2.1 消除循环中的循环依赖 | 第24-26页 |
| 2.2.2 改进数据结构 | 第26页 |
| 2.3 sander程序的MIC移植 | 第26-29页 |
| 2.4 性能测试 | 第29-32页 |
| 2.4.1 实验平台和数据 | 第29页 |
| 2.4.2 sander-omp并行效果 | 第29-30页 |
| 2.4.3 sander-MIC的并行优化效果 | 第30-32页 |
| 2.5 本章小结 | 第32-33页 |
| 第三章 天河2号上CPU与MIC协同的AMBER并行化技术 | 第33-41页 |
| 3.1 AMBER-sander的CPU与MIC协同并行的设计与实现 | 第33-34页 |
| 3.2 AMBER-sander的深度并行优化 | 第34-37页 |
| 3.2.1 内存管理深度优化 | 第34-35页 |
| 3.2.2 数据传输优化 | 第35页 |
| 3.2.3 通信延迟隐藏 | 第35页 |
| 3.2.4 向量化优化 | 第35-37页 |
| 3.3 AMBER-sander的负载均衡优化 | 第37页 |
| 3.4 性能评测 | 第37-40页 |
| 3.4.1 实验数据和平台 | 第37页 |
| 3.4.2 CPU与MIC协同并行加速效果 | 第37-39页 |
| 3.4.3 深度并行优化性能测试 | 第39-40页 |
| 3.5 本章小结 | 第40-41页 |
| 第四章 天河2号上AMBER程序可扩展性技术研究 | 第41-48页 |
| 4.1 AMBER程序的跨节点并行算法分析 | 第41-44页 |
| 4.2 AMBER程序多节点并行的设计与分析 | 第44-47页 |
| 4.2.1 AMBER程序的多节点并行算法改进及优化 | 第44-45页 |
| 4.2.2 ABMER程序基于CPU和MIC对等模式的多节点并行优化 | 第45-47页 |
| 4.3 本章小结 | 第47-48页 |
| 第五章 结束语 | 第48-50页 |
| 5.1 工作总结 | 第48-49页 |
| 5.2 研究展望 | 第49-50页 |
| 致谢 | 第50-52页 |
| 参考文献 | 第52-55页 |
| 作者在学期间取得的学术成果 | 第55页 |