首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

类数据流驱动的分片式处理器体系结构

摘要第1-7页
ABSTRACT第7-20页
第1章 绪论第20-33页
   ·研究背景第20-24页
     ·半导体工艺发展对处理器体系结构的影响第20-21页
     ·分片式处理器及研究意义第21-24页
   ·分片式处理器体系结构设计中的关键问题第24-30页
     ·处理器核的粒度第24-26页
     ·适应不同并行性应用的能力第26-27页
     ·程序执行模型第27-29页
     ·处理单元间的互连第29-30页
   ·论文研究目标和主要工作第30-31页
   ·论文结构第31-33页
第2章 分片式处理器的相关研究工作第33-51页
   ·RAW和TILE64第33-37页
     ·执行模型第33-35页
     ·RAW体系结构第35-36页
     ·TILE64体系结构第36-37页
   ·Smart Memories第37-40页
     ·执行模型第38-39页
     ·Smart Memories体系结构第39-40页
   ·TRIPS和TFLEX第40-42页
     ·执行模型第40-41页
     ·TRIPS体系结构第41页
     ·TFLEX体系结构第41-42页
   ·WaveScalar第42-45页
     ·执行模型第42-44页
     ·WaveCache体系结构第44-45页
   ·Multiscalar第45-47页
     ·执行模型第45-46页
     ·Multiscalar体系结构第46-47页
   ·分片式处理器体系结构发展趋势总结第47-51页
第3章 类数据流驱动的程序执行模型第51-77页
   ·冯·诺依曼计算模型的局限性第51-54页
     ·自身的局限性第51-53页
     ·冯·诺依曼结构在多核时代的问题第53-54页
   ·数据流驱动的执行第54-62页
     ·数据流执行的原理第54-55页
     ·数据流图第55-57页
     ·数据流模型的结构及分类第57-60页
     ·数据流计算模型分析第60-62页
   ·类数据流计算模型的原理第62-68页
     ·混合式计算模型的分类第62-64页
     ·早期的混合数据流机制第64页
     ·程序中的数据流局部性分析第64-66页
     ·类数据流计算模型第66-68页
   ·类数据流驱动的程序执行模型第68-72页
     ·超块结构第68-70页
     ·类数据流驱动的程序执行模型第70-72页
     ·类数据流驱动程序执行模型中的数据通信第72页
   ·一种类数据流驱动执行的指令集体系结构DISC-I第72-75页
     ·指令集概述第73-74页
     ·显式目标编码第74-75页
   ·编译支持第75-76页
   ·小结第76-77页
第4章 类数据流驱动的分片式处理器体系结构设计空间分析第77-113页
   ·类数据流驱动的分片式处理器体系结构抽象模型第77-83页
     ·微体系结构概述第77-78页
     ·全局控制单元CT第78-79页
     ·执行单元ET第79-80页
     ·寄存器单元RT第80页
     ·一级指令Cache IT和一级数据Cache DT第80-81页
     ·片上互连网络第81-83页
   ·基于超块的激进执行模型分析第83-94页
     ·基于控制流的激进执行模型分析第83-89页
     ·基于数据流的激进执行模型分析第89-93页
     ·小结第93-94页
   ·片上互连拓扑结构分析第94-98页
     ·互连拓扑结构设计方案第94-95页
     ·拓扑结构性能评价指标第95-96页
     ·实验结果及分析第96-98页
     ·小结第98页
   ·数据预取机制分析第98-105页
     ·数据预取算法第99页
     ·类数据流驱动程序执行模型中的数据预取第99-102页
     ·仿真实验结果及分析第102-105页
     ·小结第105页
   ·分片式处理器设计方案优化第105-111页
     ·应用在类数据流驱动程序执行模型上的特征分析第105-109页
     ·分片式处理器体系结构设计的优化思想第109-111页
   ·小结第111-113页
第5章 TPA-PI:一种类数据流驱动的分片式处理器体系结构第113-144页
   ·引言第113-114页
   ·TPA-PI处理器体系结构概述第114-116页
     ·TPA-PI处理器体系结构第114-115页
     ·分布式的执行控制第115-116页
   ·功能部件4FU设计第116-122页
     ·基本流水线第117-118页
     ·流水线的数据通路第118-122页
   ·控制模块第122-128页
     ·逻辑功能描述第122-124页
     ·控制流转移预测第124-126页
     ·控制系统设计第126-128页
   ·寄存器模块Reg第128-132页
     ·Reg微体系结构第129-131页
     ·执行机制第131-132页
   ·指令Cache第132-133页
     ·逻辑功能描述第132-133页
     ·块头指令Cache第133页
     ·常规指令Cache第133页
   ·内数据Cache第133-137页
     ·分布式的Load/Store队列第135页
     ·分布式的访存依赖预测器第135-137页
   ·片上互连网络第137-143页
     ·操作数网络第138-141页
     ·其它网络第141-143页
   ·小结第143-144页
第6章 TPA-PI处理器的性能评测第144-158页
   ·应用开发环境第144-147页
     ·软硬件环境第144-145页
     ·TPA-PI软件模拟器的实现第145-147页
   ·TPA-PI性能评测第147-156页
     ·基本模型评测第147-148页
     ·激进执行对TPA-PI性能的影响第148-150页
     ·发射宽度和指令窗口对TPA-PI性能的影响第150-151页
     ·操作数网络对TPA-PI性能的影响第151-153页
     ·与超标量处理器的比较第153-156页
     ·TPA-PI的性能提升潜力第156页
   ·小结第156-158页
第7章 全文总结第158-164页
   ·研究工作和成果第158-161页
   ·主要创新第161-162页
   ·进一步的工作第162-164页
参考文献第164-170页
致谢第170-172页
在读期间发表的学术论文与取得的研究成果第172-174页
在读期间参与的科研项目第174页

论文共174页,点击 下载论文
上一篇:高性能计算机若干关键问题研究
下一篇:类数据流驱动的分片式处理器上的编译及优化技术