面向高密度计算的多核处理器结构研究

摘要	第1-7页
ABSTRACT	第7-9页
目录	第9-12页
图目录	第12-14页
表目录	第14-15页
第1章绪论	第15-23页
·研究背景	第15-17页
·微处理器在高性能计算中的应用	第15-16页
·微处理器发展现状	第16-17页
·本文研究的问题及意义	第17-18页
·国内外研究现状	第18-20页
·本文研究内容及论文组织	第20-23页
第2章面向高密度计算的相关研究工作	第23-45页
·几种面向高密度计算的处理器结构	第23-33页
·Cell处理器	第23-24页
·TRIPS处理器	第24-25页
·Intel core i7处理器	第25-26页
·GPU处理器结构	第26-28页
·Godson-3号处理器	第28-29页
·计算/访存分离的处理器结构模型	第29-33页
·性能分析相关研究	第33-37页
·现有的性能分析方法	第33-34页
·稀疏矩阵向量乘法性能模型	第34-36页
·矩阵乘法性能模型	第36-37页
·矩阵乘法的相关研究工作	第37-42页
·单核矩阵乘法相关工作	第37-40页
·多核矩阵乘法相关工作	第40-42页
·小结	第42-45页
第3章矩阵乘法性能模型	第45-71页
·矩阵乘法划分方法	第45-47页
·单核性能模型	第47-53页
·单核性能模型的建立	第47-51页
·处理器结构参数优化分析	第51-53页
·多核性能模型	第53-56页
·性能模型的验证	第56-67页
·Intel core i7上的性能模型验证	第56-61页
·Godson-3A上的性能模型验证	第61-67页
·小结	第67-68页
·附录	第68-71页
·引理3.1的证明	第68页
·定理3.1的证明	第68-69页
·定理3.2的证明	第69页
·定理3.3的证明	第69-71页
第4章多核处理器结构优化	第71-85页
·一种乘加-shuffle融合的浮点向量指令	第71-74页
·一种计算/访存分离的处理器结构	第74-80页
·新的计算/访存分离的处理器结构介绍	第74-75页
·访存协处理器	第75-79页
·访存协处理器的带宽测试	第79-80页
·基于性能模型对Godson-3B进行评估	第80-84页
·小结	第84-85页
第5章 Godson-3B上的矩阵乘法	第85-101页
·高效的单核矩阵乘法	第85-93页
·GEBP核心循环实现方法	第85-86页
·寄存器层的访存优化	第86-90页
·L2 cache层的访存优化	第90-93页
·多核矩阵乘法	第93-94页
·实验结果和分析	第94-99页
·实验平台介绍	第94页
·不同寄存器分组下的核心性能测试	第94-95页
·与性能模型预测值的对比	第95-97页
·GEBP核心循环中时间开销分布统计	第97-98页
·与其它处理器的比较	第98-99页
·小结	第99-101页
第6章结论	第101-103页
·本文工作总结	第101-102页
·进一步工作	第102-103页
参考文献	第103-111页
致谢	第111-113页
在读期间发表的学术论文与取得的研究成果	第113-114页
在读期间参与的科研项目	第114页