面向高密度计算的多核处理器结构研究
| 摘要 | 第1-7页 |
| ABSTRACT | 第7-9页 |
| 目录 | 第9-12页 |
| 图目录 | 第12-14页 |
| 表目录 | 第14-15页 |
| 第1章 绪论 | 第15-23页 |
| ·研究背景 | 第15-17页 |
| ·微处理器在高性能计算中的应用 | 第15-16页 |
| ·微处理器发展现状 | 第16-17页 |
| ·本文研究的问题及意义 | 第17-18页 |
| ·国内外研究现状 | 第18-20页 |
| ·本文研究内容及论文组织 | 第20-23页 |
| 第2章 面向高密度计算的相关研究工作 | 第23-45页 |
| ·几种面向高密度计算的处理器结构 | 第23-33页 |
| ·Cell处理器 | 第23-24页 |
| ·TRIPS处理器 | 第24-25页 |
| ·Intel core i7处理器 | 第25-26页 |
| ·GPU处理器结构 | 第26-28页 |
| ·Godson-3号处理器 | 第28-29页 |
| ·计算/访存分离的处理器结构模型 | 第29-33页 |
| ·性能分析相关研究 | 第33-37页 |
| ·现有的性能分析方法 | 第33-34页 |
| ·稀疏矩阵向量乘法性能模型 | 第34-36页 |
| ·矩阵乘法性能模型 | 第36-37页 |
| ·矩阵乘法的相关研究工作 | 第37-42页 |
| ·单核矩阵乘法相关工作 | 第37-40页 |
| ·多核矩阵乘法相关工作 | 第40-42页 |
| ·小结 | 第42-45页 |
| 第3章 矩阵乘法性能模型 | 第45-71页 |
| ·矩阵乘法划分方法 | 第45-47页 |
| ·单核性能模型 | 第47-53页 |
| ·单核性能模型的建立 | 第47-51页 |
| ·处理器结构参数优化分析 | 第51-53页 |
| ·多核性能模型 | 第53-56页 |
| ·性能模型的验证 | 第56-67页 |
| ·Intel core i7上的性能模型验证 | 第56-61页 |
| ·Godson-3A上的性能模型验证 | 第61-67页 |
| ·小结 | 第67-68页 |
| ·附录 | 第68-71页 |
| ·引理3.1的证明 | 第68页 |
| ·定理3.1的证明 | 第68-69页 |
| ·定理3.2的证明 | 第69页 |
| ·定理3.3的证明 | 第69-71页 |
| 第4章 多核处理器结构优化 | 第71-85页 |
| ·一种乘加-shuffle融合的浮点向量指令 | 第71-74页 |
| ·一种计算/访存分离的处理器结构 | 第74-80页 |
| ·新的计算/访存分离的处理器结构介绍 | 第74-75页 |
| ·访存协处理器 | 第75-79页 |
| ·访存协处理器的带宽测试 | 第79-80页 |
| ·基于性能模型对Godson-3B进行评估 | 第80-84页 |
| ·小结 | 第84-85页 |
| 第5章 Godson-3B上的矩阵乘法 | 第85-101页 |
| ·高效的单核矩阵乘法 | 第85-93页 |
| ·GEBP核心循环实现方法 | 第85-86页 |
| ·寄存器层的访存优化 | 第86-90页 |
| ·L2 cache层的访存优化 | 第90-93页 |
| ·多核矩阵乘法 | 第93-94页 |
| ·实验结果和分析 | 第94-99页 |
| ·实验平台介绍 | 第94页 |
| ·不同寄存器分组下的核心性能测试 | 第94-95页 |
| ·与性能模型预测值的对比 | 第95-97页 |
| ·GEBP核心循环中时间开销分布统计 | 第97-98页 |
| ·与其它处理器的比较 | 第98-99页 |
| ·小结 | 第99-101页 |
| 第6章 结论 | 第101-103页 |
| ·本文工作总结 | 第101-102页 |
| ·进一步工作 | 第102-103页 |
| 参考文献 | 第103-111页 |
| 致谢 | 第111-113页 |
| 在读期间发表的学术论文与取得的研究成果 | 第113-114页 |
| 在读期间参与的科研项目 | 第114页 |