多核环境下矩阵库设计与优化
| 摘要 | 第1-5页 |
| Abstract | 第5-9页 |
| 第1章 绪论 | 第9-16页 |
| ·课题研究背景及意义 | 第9-10页 |
| ·课题背景 | 第9页 |
| ·研究意义 | 第9-10页 |
| ·国内外研究现状 | 第10-14页 |
| ·矩阵计算研究现状 | 第10-11页 |
| ·多核处理器与并行计算简述 | 第11-14页 |
| ·本文主要研究工作与结构 | 第14-16页 |
| 第2章 矩阵库的串行设计 | 第16-30页 |
| ·矩阵的介绍 | 第16-19页 |
| ·矩阵概念 | 第16-17页 |
| ·矩阵的基本运算 | 第17-19页 |
| ·矩阵库的设计原则 | 第19页 |
| ·矩阵库的准备 | 第19-22页 |
| ·命名 | 第19-20页 |
| ·模板 | 第20-21页 |
| ·重载 | 第21页 |
| ·浮点数 | 第21-22页 |
| ·构造函数 | 第22页 |
| ·矩阵库的结构 | 第22-23页 |
| ·矩阵库的实现示例 | 第23-29页 |
| ·本章小结 | 第29-30页 |
| 第3章 矩阵库并行化 | 第30-42页 |
| ·并行编程模型和编程环境 | 第30-34页 |
| ·消息传递模型 | 第30-31页 |
| ·数据并行模型 | 第31-32页 |
| ·共享存储 | 第32页 |
| ·模型比较 | 第32-34页 |
| ·OpenMP编程介绍 | 第34-41页 |
| ·OpenMP编程模型与简例 | 第34-37页 |
| ·OpenMP指令和库函数介绍 | 第37-39页 |
| ·OpenMP编程并行化的循环选取原则 | 第39-40页 |
| ·OpenMp在矩阵库并行计算中的应用实例 | 第40-41页 |
| ·本章小结 | 第41-42页 |
| 第4章 矩阵库的优化 | 第42-48页 |
| ·优化 | 第42-45页 |
| ·优化工具介绍 | 第43页 |
| ·优化工具Intel VTune介绍 | 第43-45页 |
| ·矩阵库的优化 | 第45-47页 |
| ·本章小结 | 第47-48页 |
| 第5章 实验与结果分析 | 第48-59页 |
| ·实验环境介绍 | 第48页 |
| ·试验结果 | 第48-57页 |
| ·示例结果 | 第48-56页 |
| ·对比分析 | 第56-57页 |
| ·试验结果分析 | 第57页 |
| ·本章小结 | 第57-59页 |
| 第6章 总结与展望 | 第59-61页 |
| ·研究工作总结 | 第59页 |
| ·研究工作展望 | 第59-61页 |
| 参考文献 | 第61-65页 |
| 致谢 | 第65-66页 |
| 攻读学位期间的主要研究成果 | 第66页 |