| 摘要 | 第1-5页 |
| Abstract | 第5-9页 |
| 1.绪论 | 第9-13页 |
| ·背景 | 第9-10页 |
| ·国内外研究现状 | 第10-11页 |
| ·本论文所做工作、目的和意义 | 第11-13页 |
| ·本文所做工作 | 第12页 |
| ·论文的目的与意义 | 第12-13页 |
| 2.并行程序设计基础 | 第13-21页 |
| ·并行计算机体系结构 | 第13-17页 |
| ·共享存储体系结构 | 第13-15页 |
| ·分布式存储结构 | 第15-17页 |
| ·分布式共享存储结构 | 第17页 |
| ·并行编程设计模型 | 第17-21页 |
| ·数据并行模型 | 第17-18页 |
| ·消息传递模型 | 第18-19页 |
| ·共享变量模型 | 第19-21页 |
| 3.MPI 和 OpenMP 编程环境配置 | 第21-28页 |
| ·MPI 消息传递编程模型 | 第21-24页 |
| ·MPI 的语言支持 | 第21-22页 |
| ·MPI 的函数 | 第22页 |
| ·MPI 并行程序设计模式 | 第22-24页 |
| ·OpenMP 编程模型 | 第24-27页 |
| ·OpenMP 并行编程模型 | 第24-26页 |
| ·OpenMP 程序开发形式 | 第26-27页 |
| ·MPI 与 OpenMP 性能比较 | 第27-28页 |
| 4.MPI+OpenMP 的混合编程模型 | 第28-40页 |
| ·混合编程模型的优势 | 第28-29页 |
| ·MPI+OpenMP 混合编程基础 | 第29-34页 |
| ·混合编程的优化 | 第34-40页 |
| ·进程通信 | 第34-35页 |
| ·线程并行 | 第35-36页 |
| ·数据共享 | 第36页 |
| ·通过乱系执行提高并行能力 | 第36-37页 |
| ·更好的发挥 Cache 的效能 | 第37-40页 |
| 5.混合编程模型的实例测试 | 第40-59页 |
| ·多核机群硬件环境搭建 | 第40-41页 |
| ·软件环境配置 | 第41-44页 |
| ·MPICH 安装配置 | 第41-43页 |
| ·OpenMP 配置 | 第43页 |
| ·MPICH 与 OpenMP 在 Visual Studio 2008 中的配置 | 第43-44页 |
| ·单节点的测试 | 第44-52页 |
| ·矩阵运算算法描述 | 第45页 |
| ·基于 MPI 的矩阵运算 | 第45-48页 |
| ·基于 OpenMP 的矩阵乘法 | 第48-50页 |
| ·两种测试结果比较分析 | 第50-52页 |
| ·机群上测试 | 第52-58页 |
| ·矩阵相乘的混合编程 | 第52-54页 |
| ·混合程序的执行测试 | 第54-55页 |
| ·测试分析 | 第55-58页 |
| ·小结 | 第58-59页 |
| 6.总结和展望 | 第59-61页 |
| 参考文献 | 第61-64页 |
| 附录:攻读学位期间发表的学术论文及参与项目 | 第64-65页 |
| 致谢 | 第65-66页 |