首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

面向性能的SIMD DSP指令流调度技术研究

摘要第1-13页
Abstract第13-16页
第一章 绪论第16-38页
   ·课题研究背景第16-19页
   ·VLIW架构超宽SIMD DSP流控技术面临的问题与思考第19-27页
     ·设计空间与应用中循环特征分析第20-22页
     ·基于VLIW结构的变长指令取指发射问题第22-24页
     ·非规整控制流中向量分支的约束第24-26页
     ·非规整控制流中迭代间相关的约束第26-27页
     ·规整控制流的循环加速问题第27页
   ·面向性能的SIMD DSP指令流控制技术相关研究第27-34页
     ·设计空间探索第27-29页
     ·变长指令的取指发射机制第29-30页
     ·向量分支问题的克服第30-32页
     ·体间相关问题的克服第32-34页
     ·规整控制流的循环加速第34页
   ·本文的主要研究内容与创新工作第34-36页
   ·本文的组织结构第36-38页
第二章 超高性能DSP的参数化功耗和性能综合模型第38-52页
   ·引言第38页
   ·系统抽象第38-39页
   ·参数化性能与功耗综合模型第39-44页
     ·参数化性能模型第39-42页
     ·参数化功耗模型第42-44页
   ·实验与评测第44-51页
     ·模型有效性验证第44-46页
     ·结果分析第46-51页
   ·本章小结第51-52页
第三章 基于VLIW结构的变长指令高性能取指发射机制第52-66页
   ·引言第52页
   ·变长指令取指流水线架构与发射机制第52-61页
     ·无效取指的作废机制第52-56页
     ·缺失指令的旁路机制第56-57页
     ·变长指令发射窗第57-61页
   ·实验与评测第61-64页
     ·实验平台第61页
     ·实验结果及分析第61-64页
   ·本章小结第64-66页
第四章 向量分支线程压缩:SIMD结构上分支处理加速技术第66-82页
   ·引言第66-67页
   ·向量分支线程压缩机制与硬件实现第67-74页
     ·向量分支线程压缩DBTC第69-70页
     ·指令cache阵列与派发单元第70-71页
     ·预取和填充引擎第71-72页
     ·模式切换与取指单元第72-73页
     ·窄向量宽度应用的支撑第73-74页
   ·相关工作比较第74-76页
   ·实验与评测第76-80页
     ·硬件开销第76-77页
     ·性能评估第77-80页
   ·本章小结第80-82页
第五章 解耦迭代映射:SIMD结构上体间相关循环加速技术第82-102页
   ·引言第82-83页
   ·解耦迭代映射机制第83-91页
     ·体间相关循环的解耦迭代映射第84-89页
     ·编译支持第89-91页
   ·DIM调度与实现第91-94页
     ·预取填充引擎与指令缓存阵列第91-92页
     ·循环控制单元与指令派发单元第92-93页
     ·数据缓冲链第93-94页
   ·实验与评测第94-100页
     ·实验建立与结果第94-96页
     ·结论分析第96-100页
   ·本章小结第100-102页
第六章 规整控制流的循环加速技术与多模式指令流出第102-126页
   ·引言第102页
   ·规整控制流的循环加速技术第102-110页
     ·硬件支持软流水(HSSP)第103-108页
     ·实验评估第108-110页
   ·多模式指令流出第110-124页
     ·多模式指令流出技术概述第110页
     ·多模式指令流出的硬件实现第110-112页
     ·多模式指令流出机制第112-115页
     ·实验平台第115-119页
     ·代价与性能权衡第119-124页
   ·本章小结第124-126页
第七章 结束语第126-130页
   ·本文所做的工作第126-128页
   ·下一步的研究工作第128-130页
致谢第130-132页
参考文献第132-144页
作者在学期间取得的学术成果第144-146页

论文共146页,点击 下载论文
上一篇:面向应用的加速器增强型异构系统大规模并行计算关键技术研究
下一篇:大规模数据处理系统中MapReduce任务划分与调度关键技术研究