第一部分:PC机群的建立及并行环境的实现 | 第1-35页 |
前言 | 第14-15页 |
第一章 实现并行计算的机群系统的介绍 | 第15-21页 |
1.1 引言 | 第15-16页 |
1.2 PC机群系统的概貌 | 第16-17页 |
1.3 机群的分类 | 第17-18页 |
1.4 机群的系统结构 | 第18页 |
1.5 机群的优点 | 第18-19页 |
1.6 机群系统的发展前景 | 第19-20页 |
1.7 小结 | 第20-21页 |
第二章 建立PC机群系统和实现并行环境 | 第21-35页 |
2.1 引言 | 第21页 |
2.2 并行操作系统 | 第21-24页 |
2.2.1 Linux操作系统简介 | 第21-24页 |
2.2.1.1 Linux操作系统的管理权限 | 第22-23页 |
2.2.1.2 /etc/passwd文件 | 第23页 |
2.2.1.3 /etc/shadow文件 | 第23页 |
2.2.1.4 /etc/inetd.conf | 第23-24页 |
2.2.1.5 /etc/host.equiv文件和用户主目录下的.rhosts文件 | 第24页 |
2.3 PC机群系统的互连网络 | 第24-25页 |
2.4 并行程序设计环境 | 第25-29页 |
2.4.1 并行程序设计环境PVM | 第26页 |
2.4.2 消息传递接口标准MPI | 第26-29页 |
2.4.2.1 进程组和通信上下文 | 第26-27页 |
2.4.2.2 消息传递的实现 | 第27页 |
2.4.2.3 通讯的实现 | 第27-28页 |
2.4.2.4 集体通讯 | 第28页 |
2.4.2.5 MPI并行程序设计流程图 | 第28-29页 |
2.5 PC机群的建立 | 第29-31页 |
2.5.1 网络的安装 | 第29-31页 |
2.5.1.1 快速以太网的配置规则 | 第30页 |
2.5.1.2 网络连接方式 | 第30-31页 |
2.5.2 PC机群的节点组成 | 第31页 |
2.6 并行环境的实现 | 第31-34页 |
2.6.1 Turbo-Linux操作系统的安装及配置 | 第31-33页 |
2.6.1.1 Turbo-Linux操作系统的安装 | 第31-32页 |
2.6.1.2 Turbo-Linux操作系统的配置 | 第32-33页 |
2.6.2 MPI的安装及配置 | 第33-34页 |
2.6.2.1 MPI的安装 | 第33-34页 |
2.6.2.2 MPI的配置 | 第34页 |
2.7 小结 | 第34-35页 |
第二部分:分子动力学程序的并行化及算法的优化 | 第35-77页 |
前言 | 第35-36页 |
第一章 分子动力学程序的并行方法 | 第36-47页 |
1.1 引言 | 第36-37页 |
1.2 并行计算在国内外发展状况 | 第37-38页 |
1.3 并行计算的基本概念 | 第38-41页 |
1.3.1 并行处理中的并行性 | 第38页 |
1.3.2 并行算法的目标 | 第38页 |
1.3.3 并行算法及其度量和评价的基本参数 | 第38-41页 |
1.3.3.1 并行算法的分类 | 第39页 |
1.3.3.2 并行算法的度量标准 | 第39-40页 |
1.3.3.3 并行算法评价的基本参数 | 第40-41页 |
1.4 分子动力学(MD)的模拟方法 | 第41-44页 |
1.4.1 力的长程有效性与短程有效性 | 第42-43页 |
1.4.1.1 力的长程有效性 | 第42-43页 |
1.4.1.2 力的短程有效性 | 第43页 |
1.4.2 短程有效力在并行计算中的应用 | 第43-44页 |
1.5 分子动力学程序的并行化 | 第44-45页 |
1.6 分子动力学程序并行化的目的 | 第45-46页 |
1.7 小结 | 第46-47页 |
第二章 粒子分解算法用于短程有效的MD模拟的并行计算 | 第47-57页 |
2.1 引言 | 第47页 |
2.2.AD算法的前提条件 | 第47-48页 |
2.3 AD算法在短程有效的MD并行计算中的应用 | 第48-53页 |
2.3.1 AD算法的主旨 | 第48页 |
2.3.2 All-to-all通信 | 第48-49页 |
2.3.3 fold通信 | 第49-50页 |
2.3.4 AD算法的通信开销和信息存储 | 第50页 |
2.3.5 A1算法 | 第50-51页 |
2.3.6 A2算法 | 第51-52页 |
2.3.7 算法中的负载平衡问题 | 第52-53页 |
2.4 结果与讨论 | 第53-56页 |
2.4.1 模拟程序的验证及模拟总时间步数的选取 | 第53-54页 |
2.4.1.1 模拟程序的验证 | 第53-54页 |
2.4.1.2 模拟总时间步数的选取 | 第54页 |
2.4.2 结果与讨论 | 第54-56页 |
2.4.2.1 加速比和效率 | 第54-55页 |
2.4.2.2 粒子数对运算时间的影响 | 第55页 |
2.4.2.3 算法A1与A2的比较 | 第55-56页 |
2.5 小结 | 第56-57页 |
第三章 力分解算法用于短程有效的MD模拟的并行计算 | 第57-67页 |
3.1 引言 | 第57页 |
3.2 FD算法的前提条件 | 第57-58页 |
3.3 FD算法在短程有效的MD并行计算中的应用 | 第58-61页 |
3.3.1 FD算法的主旨 | 第58-59页 |
3.3.2 F1算法 | 第59-60页 |
3.3.3 F2算法 | 第60-61页 |
3.3.4 比较算法F1、F2、A1和A2 | 第61页 |
3.3.5 FD算法的负载平衡问题 | 第61页 |
3.4 结果与讨论 | 第61-66页 |
3.4.1 模拟程序的验证及模拟总时间步数的选取 | 第62-63页 |
3.4.1.1 模拟程序的验证 | 第62页 |
3.4.1.2 模拟总时间步数的选取 | 第62-63页 |
3.4.2 结果与讨论 | 第63-66页 |
3.4.2.1 加速比和效率 | 第63页 |
3.4.2.2 粒子数对运行时间的影响 | 第63-64页 |
3.4.2.3 算法F1与F2的比较 | 第64-65页 |
3.4.2.4 算法AD和算法FD的比较 | 第65-66页 |
3.5 小结 | 第66-67页 |
第四章 空间分解算法用于短程有效MD模拟的并行计算 | 第67-77页 |
4.1 引言 | 第67页 |
4.2 SD算法的前提条件 | 第67-68页 |
4.3 SD算法在短程有效的MD并行计算中的应用 | 第68-72页 |
4.3.1 SD算法的主旨 | 第68-69页 |
4.3.2 S1算法 | 第69-71页 |
4.3.3 S2算法 | 第71-72页 |
4.3.4 负载平衡问题 | 第72页 |
4.4 结果与讨论 | 第72-76页 |
4.4.1 模拟程序的验证及模拟总时间步数的选取 | 第72-76页 |
4.4.1.1 模拟程序的验证 | 第72-73页 |
4.4.1.2 模拟总时间步数的选取 | 第73页 |
4.4.1.3 加速比与效率 | 第73-74页 |
4.4.1.4 粒子数对运行时间的影响 | 第74-75页 |
4.4.1.5 并行算法的阶 | 第75-76页 |
4.5 小结 | 第76-77页 |
第三部分 结论 | 第77-79页 |
参考文献 | 第79-87页 |
附表 | 第87-90页 |
致谢 | 第90-91页 |
攻读硕士学位期间论文发表情况 | 第91页 |