首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

分片式流处理器体系结构

摘要第1-7页
ABSTRACT第7-17页
第1章 绪论第17-27页
   ·研究背景第17-19页
     ·半导体工艺的发展第17页
     ·流处理器体系结构的发展第17-18页
     ·处理器的分片式设计及其意义第18-19页
   ·分片式流处理器设计的几个关键问题第19-25页
     ·计算模型第19-22页
     ·片上存储层次第22-23页
     ·片上互连网络第23页
     ·编程模型以及代码重用第23-25页
   ·论文研究目标和主要工作第25-26页
   ·论文结构第26-27页
第2章 流处理器以及众核处理器相关研究工作第27-44页
   ·Imagine和Storm处理器及其编程模型第27-29页
   ·IBM的Cell处理器及其编程模型第29-32页
   ·NVIDIA的GPU及其编程模型第32-35页
   ·TRIPS和TFLEX第35-37页
   ·RAW和TILE64第37-40页
   ·Intel的Polaris和Larabee处理器第40-41页
   ·小结第41-44页
第3章 流编程模型和程序计算模型第44-61页
   ·程序执行模型第44-45页
   ·TPA-PD的流编程模型第45-49页
     ·StreamC语言第45-46页
     ·KernelC语言第46-49页
   ·TPA-PD的计算模型第49-56页
     ·SBMD模型第50-55页
     ·超块的执行第55-56页
   ·TPA-PD的指令系统第56-60页
     ·流级指令第56-58页
     ·Kernel级指令第58-60页
   ·小结第60-61页
第4章 TPA-PD处理器的体系结构第61-89页
   ·控制块(Control tile,CT)第62-65页
     ·主机接口第62-63页
     ·记分板和发射单元第63-64页
     ·块引擎第64-65页
   ·执行块(Execution tile,ET)第65-70页
     ·保留站第66页
     ·算术、逻辑单元第66-70页
   ·寄存器块(Register Tile,RT)第70-72页
   ·指令块(Instruction Tile,IT)第72-73页
   ·数据块(Data Tile,DT)第73-74页
     ·流读写队列(slsq)第73页
     ·便签簿读写队列(sprwq)第73-74页
     ·本地块间数据依赖队列(lrwq)第74页
   ·存储块(Memory Tile,MT)第74-81页
   ·流访存部件(Stream Load/Store Unit,SU)第81-83页
   ·片上互连网络第83-88页
     ·操作数传递网络(Operator Transfer Network,OTN)第83-84页
     ·指令传递网络(Instruction Dispatch Network,IDN)第84-85页
     ·全局控制网络(Global Control Network,GCN)第85-87页
     ·全局状态网络(Global Status Network,GSN)第87-88页
     ·流数据传递网络(Stream Transfer Network,STN)第88页
   ·小结第88-89页
第5章 编译系统实现第89-104页
   ·编译方案第89-90页
   ·流级翻译器(Stream Level Translator,SLT)第90-91页
   ·Kernel级二进制翻译器(Kernel Level Binary Translator,KLBT)第91-104页
     ·设计概述第91页
     ·指令解码第91-92页
     ·还原控制流图第92-94页
     ·还原数据流图第94-97页
     ·指令翻译第97-100页
     ·构建SBMD模型下的控制流图和数据流图第100-101页
     ·指令调整和调度第101-102页
     ·指令编码第102-103页
     ·指令封装第103页
     ·小结第103-104页
第6章 处理器性能评测第104-128页
   ·评测环境和Benchmark第104-110页
     ·TPA-PD的软件环境第104-107页
     ·Benchmark第107-110页
   ·TPA-PD的超块资源第110-111页
   ·TPA-PD的计算资源第111-113页
   ·TPA-PD的片上网络资源第113-116页
   ·TPA-PD的流访存部件第116-118页
   ·优化超块的发射和提交第118-120页
   ·指令调度算法第120-122页
   ·TPA-PD和Imagine处理器的对比第122-125页
   ·小结第125-128页
第7章 全文总结第128-132页
   ·研究工作总结第128-129页
   ·本文创新点第129-131页
   ·进一步的工作第131-132页
参考文献第132-138页
致谢第138-139页
在读期间发表的学术论文与取得的研究成果第139-141页
在读期间参与的科研项目第141-142页

论文共142页,点击 下载论文
上一篇:面向共享存储系统的计算模型及性能优化
下一篇:逻辑核动态可重构的众核处理器体系结构