首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

面向高密度计算的多核处理器结构研究

摘要第1-7页
ABSTRACT第7-9页
目录第9-12页
图目录第12-14页
表目录第14-15页
第1章 绪论第15-23页
   ·研究背景第15-17页
     ·微处理器在高性能计算中的应用第15-16页
     ·微处理器发展现状第16-17页
   ·本文研究的问题及意义第17-18页
   ·国内外研究现状第18-20页
   ·本文研究内容及论文组织第20-23页
第2章 面向高密度计算的相关研究工作第23-45页
   ·几种面向高密度计算的处理器结构第23-33页
     ·Cell处理器第23-24页
     ·TRIPS处理器第24-25页
     ·Intel core i7处理器第25-26页
     ·GPU处理器结构第26-28页
     ·Godson-3号处理器第28-29页
     ·计算/访存分离的处理器结构模型第29-33页
   ·性能分析相关研究第33-37页
     ·现有的性能分析方法第33-34页
     ·稀疏矩阵向量乘法性能模型第34-36页
     ·矩阵乘法性能模型第36-37页
   ·矩阵乘法的相关研究工作第37-42页
     ·单核矩阵乘法相关工作第37-40页
     ·多核矩阵乘法相关工作第40-42页
   ·小结第42-45页
第3章 矩阵乘法性能模型第45-71页
   ·矩阵乘法划分方法第45-47页
   ·单核性能模型第47-53页
     ·单核性能模型的建立第47-51页
     ·处理器结构参数优化分析第51-53页
   ·多核性能模型第53-56页
   ·性能模型的验证第56-67页
     ·Intel core i7上的性能模型验证第56-61页
     ·Godson-3A上的性能模型验证第61-67页
   ·小结第67-68页
   ·附录第68-71页
     ·引理3.1的证明第68页
     ·定理3.1的证明第68-69页
     ·定理3.2的证明第69页
     ·定理3.3的证明第69-71页
第4章 多核处理器结构优化第71-85页
   ·一种乘加-shuffle融合的浮点向量指令第71-74页
   ·一种计算/访存分离的处理器结构第74-80页
     ·新的计算/访存分离的处理器结构介绍第74-75页
     ·访存协处理器第75-79页
     ·访存协处理器的带宽测试第79-80页
   ·基于性能模型对Godson-3B进行评估第80-84页
   ·小结第84-85页
第5章 Godson-3B上的矩阵乘法第85-101页
   ·高效的单核矩阵乘法第85-93页
     ·GEBP核心循环实现方法第85-86页
     ·寄存器层的访存优化第86-90页
     ·L2 cache层的访存优化第90-93页
   ·多核矩阵乘法第93-94页
   ·实验结果和分析第94-99页
     ·实验平台介绍第94页
     ·不同寄存器分组下的核心性能测试第94-95页
     ·与性能模型预测值的对比第95-97页
     ·GEBP核心循环中时间开销分布统计第97-98页
     ·与其它处理器的比较第98-99页
   ·小结第99-101页
第6章 结论第101-103页
   ·本文工作总结第101-102页
   ·进一步工作第102-103页
参考文献第103-111页
致谢第111-113页
在读期间发表的学术论文与取得的研究成果第113-114页
在读期间参与的科研项目第114页

论文共114页,点击 下载论文
上一篇:细分曲面理论及其应用问题的研究
下一篇:面向服务的云会议系统架构及其关键技术研究