首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--存贮器论文

超宽SIMD DSP片上并行数据访存关键技术研究

摘要第1-14页
ABSTRACT第14-16页
第一章 绪论第16-40页
   ·研究背景第16-23页
     ·高性能嵌入式应用的不断发展和演进第16-18页
     ·超宽SIMD成为高端DSP的主流第18-23页
   ·超宽SIMD DSP片上数据访存面临的问题和思考第23-29页
     ·“存储墙”问题的产生和由来第24-25页
     ·存储体的端口限制和不规则访存第25-26页
     ·两维访存需求与一维存储空间约束第26-27页
     ·片上并行存储机制及其前景思考第27-29页
   ·研究现状第29-36页
     ·存储体的组成方式第29-30页
     ·存储空间的映射方式第30-32页
     ·存储空间的表示方式第32页
     ·并行存储机制设计实例第32-33页
     ·减少并行存储机制的竞争第33-34页
     ·数据混洗技术第34-35页
     ·当前工作存在的问题第35-36页
   ·本文的研究内容第36-38页
   ·论文结构第38-40页
第二章 模块数匹配的双线性偏斜2D存储机制第40-56页
   ·相关研究工作第40-41页
   ·理论阐述第41-49页
     ·映射函数第41-42页
     ·访问模式第42-46页
     ·地址产生单元第46-48页
     ·数据处理第48页
     ·线性寻址和循环寻址第48-49页
   ·硬件实现第49-50页
   ·实验与评测第50-55页
     ·存储模块面积开销第50-52页
     ·控制逻辑面积开销第52-54页
     ·控制逻辑时序开销第54-55页
   ·本章小结第55-56页
第三章 基于相邻访存数据重用的低功耗2D存储机制第56-74页
   ·背景和动机第56-61页
     ·滑窗类应用第56-57页
     ·两种广泛采用的支持块访问的2D存储器第57-60页
     ·LP2D的设计动机第60-61页
   ·理论阐述第61-67页
     ·定义与假设第61-62页
     ·定理推导第62-67页
   ·硬件实现第67-69页
   ·实验与评测第69-73页
     ·额外的硬件开销评估第69-70页
     ·实验平台搭建第70-71页
     ·实验结果第71-73页
   ·本章小结第73-74页
第四章 面向应用领域的多态并行存储方案第74-91页
   ·背景和动机第75-77页
     ·传统的SIMD处理器存储模型第75-76页
     ·无线通讯和视频应用中的不规则访存分析第76-77页
   ·面向应用领域的多态并行存储方案第77-86页
     ·微体系结构第77-83页
     ·访存指令第83页
     ·编程示例第83-86页
   ·实验与评测第86-90页
     ·硬件实现开销第86-87页
     ·实验平台第87-88页
     ·实验结果第88-90页
   ·本章小结第90-91页
第五章 向量DMA Cache技术第91-111页
   ·背景和动机第92-95页
     ·超宽SIMD DSP中的DMA技术及数据流特征第92-93页
     ·DMA Cache模型第93-95页
   ·VDC的特征和技术环节第95-99页
     ·分离的读请求Cache和写请求Cache第95页
     ·满行自动更新策略第95-97页
     ·软件Cache一致性协议第97-99页
   ·VDC的硬件实现第99-102页
     ·VDC的硬件结构第100-102页
     ·其它模块的修改第102页
   ·实验与评测第102-110页
     ·实验平台第102-104页
     ·实验结果第104-109页
     ·VDC硬件实现开销评估第109页
     ·四种VM模型的综合比较第109-110页
   ·本章小结第110-111页
第六章 高效的可编程混洗单元及混洗矩阵奇偶划分方法第111-131页
   ·具有高效混洗模式存储器的可编程洗单元第113-116页
     ·整体结构第113页
     ·高效混洗模式存储器的实现第113-114页
     ·压缩混洗模式引入的时间开销分析第114-115页
     ·混洗指令第115-116页
   ·混洗矩阵奇偶划分方法第116-126页
     ·基本定义及矩阵分块方法第116-119页
     ·奇偶划分方法介绍第119页
     ·奇偶划分方法的性质及证明第119-124页
     ·基于奇偶划分方法的混洗机制第124-126页
   ·实验与评测第126-130页
     ·高效的可编程混洗单元的硬件开销和存储效率第126-127页
     ·高效的可编程混洗单元对程序执行效率的提升第127-128页
     ·奇偶划分方法在硬件开销方面的优势第128-130页
   ·本章小结第130-131页
第七章 超宽SIMD DSP原型芯片的实现与评估第131-144页
   ·FT-Matrix系列DSP第131-135页
     ·FT-Matrix的整体结构第131-132页
     ·软件模拟器FT-Matrix-Sim第132-133页
     ·多核版本FT-QMBase第133-134页
     ·FT-Matrix-2第134-135页
   ·FT-Matrix的向量存储单元第135-137页
   ·FT-Matrix的混洗单元第137-139页
   ·本文提出的技术的应用情况和整体评估第139-143页
     ·提出的技术在原型芯片中的应用情况第139-140页
     ·提出的技术的整体评估第140-143页
   ·本章小结第143-144页
第八章 结论与展望第144-148页
   ·本文的主要工作第144-146页
   ·研究展望第146-148页
致谢第148-149页
参考文献第149-160页
作者在学期间取得的学术成果第160-163页

论文共163页,点击 下载论文
上一篇:干涉逆合成孔径雷达(InISAR)三维成像技术研究
下一篇:多核多处理器系统的节能实时调度技术研究