面向高密度计算的多核处理器结构研究
摘要 | 第1-7页 |
ABSTRACT | 第7-9页 |
目录 | 第9-12页 |
图目录 | 第12-14页 |
表目录 | 第14-15页 |
第1章 绪论 | 第15-23页 |
·研究背景 | 第15-17页 |
·微处理器在高性能计算中的应用 | 第15-16页 |
·微处理器发展现状 | 第16-17页 |
·本文研究的问题及意义 | 第17-18页 |
·国内外研究现状 | 第18-20页 |
·本文研究内容及论文组织 | 第20-23页 |
第2章 面向高密度计算的相关研究工作 | 第23-45页 |
·几种面向高密度计算的处理器结构 | 第23-33页 |
·Cell处理器 | 第23-24页 |
·TRIPS处理器 | 第24-25页 |
·Intel core i7处理器 | 第25-26页 |
·GPU处理器结构 | 第26-28页 |
·Godson-3号处理器 | 第28-29页 |
·计算/访存分离的处理器结构模型 | 第29-33页 |
·性能分析相关研究 | 第33-37页 |
·现有的性能分析方法 | 第33-34页 |
·稀疏矩阵向量乘法性能模型 | 第34-36页 |
·矩阵乘法性能模型 | 第36-37页 |
·矩阵乘法的相关研究工作 | 第37-42页 |
·单核矩阵乘法相关工作 | 第37-40页 |
·多核矩阵乘法相关工作 | 第40-42页 |
·小结 | 第42-45页 |
第3章 矩阵乘法性能模型 | 第45-71页 |
·矩阵乘法划分方法 | 第45-47页 |
·单核性能模型 | 第47-53页 |
·单核性能模型的建立 | 第47-51页 |
·处理器结构参数优化分析 | 第51-53页 |
·多核性能模型 | 第53-56页 |
·性能模型的验证 | 第56-67页 |
·Intel core i7上的性能模型验证 | 第56-61页 |
·Godson-3A上的性能模型验证 | 第61-67页 |
·小结 | 第67-68页 |
·附录 | 第68-71页 |
·引理3.1的证明 | 第68页 |
·定理3.1的证明 | 第68-69页 |
·定理3.2的证明 | 第69页 |
·定理3.3的证明 | 第69-71页 |
第4章 多核处理器结构优化 | 第71-85页 |
·一种乘加-shuffle融合的浮点向量指令 | 第71-74页 |
·一种计算/访存分离的处理器结构 | 第74-80页 |
·新的计算/访存分离的处理器结构介绍 | 第74-75页 |
·访存协处理器 | 第75-79页 |
·访存协处理器的带宽测试 | 第79-80页 |
·基于性能模型对Godson-3B进行评估 | 第80-84页 |
·小结 | 第84-85页 |
第5章 Godson-3B上的矩阵乘法 | 第85-101页 |
·高效的单核矩阵乘法 | 第85-93页 |
·GEBP核心循环实现方法 | 第85-86页 |
·寄存器层的访存优化 | 第86-90页 |
·L2 cache层的访存优化 | 第90-93页 |
·多核矩阵乘法 | 第93-94页 |
·实验结果和分析 | 第94-99页 |
·实验平台介绍 | 第94页 |
·不同寄存器分组下的核心性能测试 | 第94-95页 |
·与性能模型预测值的对比 | 第95-97页 |
·GEBP核心循环中时间开销分布统计 | 第97-98页 |
·与其它处理器的比较 | 第98-99页 |
·小结 | 第99-101页 |
第6章 结论 | 第101-103页 |
·本文工作总结 | 第101-102页 |
·进一步工作 | 第102-103页 |
参考文献 | 第103-111页 |
致谢 | 第111-113页 |
在读期间发表的学术论文与取得的研究成果 | 第113-114页 |
在读期间参与的科研项目 | 第114页 |