首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

OpenMP并行编程模型与性能优化方法的研究及应用

摘要第1-6页
Abstract第6-11页
第1章 引言第11-15页
   ·概述第11-13页
     ·并行计算技术的发展前景第11-12页
     ·多核处理器的发展第12页
     ·共享存储编程模型研究现状第12-13页
   ·本文的主要研究工作第13-15页
     ·研究内容第13-14页
     ·本文的创新点第14-15页
第2章 多核并行计算概述第15-25页
   ·多级存储体系结构第15-17页
     ·Cache 映射策略第15-16页
     ·并行计算机的访存模型第16-17页
   ·并行计算模型第17-18页
     ·SIMD 同步并行计算模型第17-18页
     ·MIMD 异步并行计算模型第18页
   ·并行程序设计模型第18-19页
     ·共享变量模型第18-19页
     ·消息传递模型第19页
     ·数据并行模型第19页
   ·并行程序设计方法第19-22页
     ·数据分解法第19页
     ·分治法第19-20页
     ·流水线模式第20页
     ·任务并行第20-21页
     ·任务图调度法第21页
     ·动态任务调度法第21-22页
   ·影响多核并行计算性能的因素第22-25页
     ·Cache 命中率问题第22-23页
     ·伪共享问题第23-25页
第3章 OpenMP 编程模式与程序性能优化方法第25-44页
   ·OpenMP 编程模型第25-29页
     ·OpenMP 介绍第25-27页
     ·内存模型第27-28页
     ·并行方式第28页
     ·嵌套并行第28-29页
     ·数据环境第29页
     ·OpenMP 编译及处理器绑定第29页
   ·OpenMP 并行程序的编程模式第29-31页
     ·fork-join 模式第30页
     ·SPMD 模式第30-31页
   ·OpenMP 性能分析第31-32页
     ·OpenMP 开销模型第31页
     ·影响OpenMP 并行算法性能的因素第31-32页
   ·OpenMP 并行程序优化方法第32-44页
     ·并行域的扩展与合并第32-35页
     ·Cache 命中率优化第35-37页
     ·循环调度方式优化第37-38页
     ·变量属性的优化第38-39页
     ·处理器线程绑定优化第39-41页
     ·降低伪共享问题的优化方法第41页
     ·并行程序性能优化方法实验与分析第41-44页
第4章 大型稀疏矩阵的OpenMP 算法研究及实现第44-61页
   ·解大型稀疏矩阵特征值串行算法第44-48页
     ·逆幂法第44-45页
     ·共轭梯度法第45-48页
   ·解大型稀疏矩阵特征值并行化研究第48-49页
     ·并行化的必要性和可行性第48-49页
     ·并行算法设计难点第49页
   ·大型稀疏矩阵向量乘积并行算法设计第49-51页
     ·CSR 存储结构第49-50页
     ·稀疏矩阵向量乘积的OpenMP 并行算法第50-51页
     ·稀疏矩阵向量乘积的性能分析第51页
   ·大型稀疏矩阵向量乘积并行算法优化第51-56页
     ·寄存器分块算法第51-53页
     ·Cache 分块算法第53-54页
     ·数据压缩优化方法第54-56页
     ·循环优化方法第56页
   ·解大型稀疏矩阵特征值的OpenMP 并行算法实现第56-61页
     ·OpenMP 并行化的一般方法第56-57页
     ·逆幂法并行化的实现方法第57-58页
     ·共轭梯度法求解大型稀疏方程组的并行化的实现方法第58-61页
第5章 算法性能测试与性能分析第61-66页
   ·测试环境第61页
   ·测试结果及分析第61-66页
     ·稀疏矩阵的规模小于Cache 存储容量的测试第61-63页
     ·稀疏矩阵的规模大于Cache 存储容量的测试第63-66页
结论第66-68页
致谢第68-69页
参考文献第69-72页
攻读学位期间取得的成果第72页

论文共72页,点击 下载论文
上一篇:基于数字图像处理的人脸检测算法研究与实现
下一篇:基于Linux的虚拟化技术研究和应用