图目录 | 第1-8页 |
表目录 | 第8-9页 |
摘要 | 第9-10页 |
ABSTRACT | 第10-11页 |
第一章 绪论 | 第11-19页 |
·课题背景 | 第11-12页 |
·国内外研究现状 | 第12-17页 |
·多级并行性开发研究现状 | 第12-15页 |
·性能评价与分析模型研究现状 | 第15-17页 |
·本文主要工作与创新 | 第17页 |
·本文组织结构 | 第17-19页 |
第二章 并行系统可扩展性研究 | 第19-27页 |
·引言 | 第19页 |
·常用可扩展模型与分析 | 第19-21页 |
·可扩展模型分类与可扩展性的一般定义 | 第21-22页 |
·可扩展模型的分类 | 第21-22页 |
·可扩展性的一般定义 | 第22页 |
·等通信需求可扩展模型 | 第22-24页 |
·问题的提出 | 第22-23页 |
·等通信需求模型的描述 | 第23页 |
·等通信需求模型的意义 | 第23-24页 |
·实例分析 | 第24-26页 |
·本章小结 | 第26-27页 |
第三章 多级并行优化的性能分析评价与映射策略 | 第27-40页 |
·多级并行计算时间模型 | 第27-31页 |
·共享存储时间模型 | 第27-28页 |
·分布式存储时间模型 | 第28-29页 |
·多级并行计算时间模型 | 第29-31页 |
·多级并行优化的性能评价与分析 | 第31-33页 |
·SMP 集群性能的衡量标准 | 第31页 |
·加速比性能评价模型 | 第31-33页 |
·常用的多级并行优化技术 | 第33-35页 |
·MPI 并行与优化技术 | 第33-34页 |
·OpenMP 并行与优化技术 | 第34页 |
·单处理器的性能优化 | 第34-35页 |
·混合编程的一些问题 | 第35页 |
·计算网格到处理器网格的新型数据映射策略 | 第35-38页 |
·问题的提出 | 第35-36页 |
·二维计算网格到处理器网格的数据映射策略 | 第36-37页 |
·三维计算网格到处理器网格的数据映射策略 | 第37-38页 |
·本章小结 | 第38-40页 |
第四章 并行矩阵乘的多级并行性开发与性能优化 | 第40-52页 |
·引言 | 第40页 |
·正方网格上的Fox 算法 | 第40-42页 |
·长方网格上的Fox 算法 | 第42-43页 |
·长方网格上的改进型Fox 算法 | 第43-44页 |
·多级并行性开发与性能优化 | 第44-50页 |
·实现过程 | 第44-46页 |
·实验结果 | 第46-48页 |
·结果分析 | 第48-50页 |
·本章小结 | 第50-52页 |
第五章 CFD 业务程序LM3D 的多级并行性开发与性能优化 | 第52-63页 |
·引言 | 第52页 |
·控制方程及其求解方法 | 第52-53页 |
·LM3D 并行计算方法 | 第53-55页 |
·多级并行性开发 | 第55-58页 |
·离散网格的OpenMP 划分 | 第55-56页 |
·MPI+OpenMP 混合编程实现 | 第56-58页 |
·实验结果与分析 | 第58-61页 |
·LM3D 单机性能优化 | 第61-62页 |
·本章小结 | 第62-63页 |
第六章 爆炸冲击波模拟程序的并行性开发与性能优化 | 第63-71页 |
·引言 | 第63页 |
·控制方程 | 第63-65页 |
·单机性能优化 | 第65页 |
·并行计算方法 | 第65-66页 |
·数据相关性及其对并行计算的影响 | 第65-66页 |
·对离散网格进行区域分解的思想 | 第66页 |
·并行数值模拟性能评价与分析 | 第66-70页 |
·并行程序性能评价 | 第66-67页 |
·新型数据映射策略的应用与分析 | 第67-68页 |
·并行计算与串行计算结果的误差分析 | 第68-70页 |
·本章小结 | 第70-71页 |
第七章 结束语 | 第71-72页 |
致谢 | 第72-73页 |
攻读硕士期间发表的论文 | 第73-74页 |
参考文献 | 第74-78页 |