多核环境下矩阵库设计与优化
摘要 | 第1-5页 |
Abstract | 第5-9页 |
第1章 绪论 | 第9-16页 |
·课题研究背景及意义 | 第9-10页 |
·课题背景 | 第9页 |
·研究意义 | 第9-10页 |
·国内外研究现状 | 第10-14页 |
·矩阵计算研究现状 | 第10-11页 |
·多核处理器与并行计算简述 | 第11-14页 |
·本文主要研究工作与结构 | 第14-16页 |
第2章 矩阵库的串行设计 | 第16-30页 |
·矩阵的介绍 | 第16-19页 |
·矩阵概念 | 第16-17页 |
·矩阵的基本运算 | 第17-19页 |
·矩阵库的设计原则 | 第19页 |
·矩阵库的准备 | 第19-22页 |
·命名 | 第19-20页 |
·模板 | 第20-21页 |
·重载 | 第21页 |
·浮点数 | 第21-22页 |
·构造函数 | 第22页 |
·矩阵库的结构 | 第22-23页 |
·矩阵库的实现示例 | 第23-29页 |
·本章小结 | 第29-30页 |
第3章 矩阵库并行化 | 第30-42页 |
·并行编程模型和编程环境 | 第30-34页 |
·消息传递模型 | 第30-31页 |
·数据并行模型 | 第31-32页 |
·共享存储 | 第32页 |
·模型比较 | 第32-34页 |
·OpenMP编程介绍 | 第34-41页 |
·OpenMP编程模型与简例 | 第34-37页 |
·OpenMP指令和库函数介绍 | 第37-39页 |
·OpenMP编程并行化的循环选取原则 | 第39-40页 |
·OpenMp在矩阵库并行计算中的应用实例 | 第40-41页 |
·本章小结 | 第41-42页 |
第4章 矩阵库的优化 | 第42-48页 |
·优化 | 第42-45页 |
·优化工具介绍 | 第43页 |
·优化工具Intel VTune介绍 | 第43-45页 |
·矩阵库的优化 | 第45-47页 |
·本章小结 | 第47-48页 |
第5章 实验与结果分析 | 第48-59页 |
·实验环境介绍 | 第48页 |
·试验结果 | 第48-57页 |
·示例结果 | 第48-56页 |
·对比分析 | 第56-57页 |
·试验结果分析 | 第57页 |
·本章小结 | 第57-59页 |
第6章 总结与展望 | 第59-61页 |
·研究工作总结 | 第59页 |
·研究工作展望 | 第59-61页 |
参考文献 | 第61-65页 |
致谢 | 第65-66页 |
攻读学位期间的主要研究成果 | 第66页 |