基于MPI的矩阵运算算法研究与实现
摘要 | 第4-6页 |
Abstract | 第6-7页 |
第1章 绪论 | 第11-18页 |
1.1 研究背景及意义 | 第11-13页 |
1.2 并行计算研究现状 | 第13-16页 |
1.2.1 国内研究现状 | 第13-14页 |
1.2.2 国外研究情况 | 第14-16页 |
1.3 本文所做的主要工作 | 第16-18页 |
第2章 并行计算基础 | 第18-29页 |
2.1 机群体系结构要素 | 第18-19页 |
2.2 并行机分类 | 第19-22页 |
2.3 并行算法分类 | 第22页 |
2.4 并行算法性能分析 | 第22-24页 |
2.4.1 执行时间 | 第22页 |
2.4.2 加速比 | 第22-24页 |
2.4.3 效率 | 第24页 |
2.5 并行算法计算模型 | 第24-25页 |
2.5.1 描述 LogP 模型的 4 个参数 | 第24页 |
2.5.2 LogP 模型的特点与提倡的技术 | 第24-25页 |
2.6 MPI 编程简介 | 第25-29页 |
2.6.1 MPI 编程模式 | 第25-26页 |
2.6.2 MPI 并行程序设计 | 第26-29页 |
第3章 矩阵乘并行算法研究及实验平台搭建 | 第29-50页 |
3.1 问题描述 | 第29-30页 |
3.2 并行算法设计方法 | 第30-31页 |
3.3 矩阵乘的并行算法 | 第31-42页 |
3.3.1 并行任务的划分 | 第31页 |
3.3.2 带状划分下的并行算法 | 第31-42页 |
3.4 实验平台的构建 | 第42-50页 |
3.4.1 PC 机群的构建 | 第42-43页 |
3.4.2 MPICH2 的安装与配置 | 第43-47页 |
3.4.3 并行程序开发工具安装 | 第47-50页 |
第4章 矩阵运算的并行应用 | 第50-65页 |
4.1 矩阵乘的并行实现、测试与分析 | 第50-59页 |
4.1.1 串行部分的性能优化 | 第51-53页 |
4.1.2 并行部分的性能优化 | 第53-57页 |
4.1.3 各算法的执行效果与分析 | 第57-59页 |
4.2 通过调用并行库求解问题 | 第59页 |
4.3 基于矩阵乘的最短路径求解问题 | 第59-62页 |
4.3.1 Floyed 算法 | 第60-61页 |
4.3.2 最短路径并行算法设计 | 第61-62页 |
4.4 矩阵的卷积运算算法设计与实现 | 第62-65页 |
4.4.1 卷积计算基本原理 | 第62-63页 |
4.4.2 卷积路径 | 第63页 |
4.4.3 卷积计算串行算法设计 | 第63-64页 |
4.4.4 卷积计算并行算法设计与实现 | 第64-65页 |
第5章 总结与展望 | 第65-67页 |
5.1 本文的主要工作 | 第65页 |
5.2 不足和进一步的工作计划 | 第65-67页 |
参考文献 | 第67-69页 |
作者简介及在学期间所取得的科研成果 | 第69-70页 |
致谢 | 第70页 |