首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

基于超长指令字模板高精度算法加速器体系结构研究

目录第1-8页
表目录第8-9页
图目录第9-12页
摘要第12-14页
Abstract第14-16页
第一章 绪论第16-42页
   ·课题背景第16-28页
     ·高精度计算的作用第16-21页
     ·FPGA 可重构计算第21-26页
     ·FPGA 实现高精度计算面临的挑战第26-28页
     ·课题来源第28页
   ·研究现状第28-38页
     ·浮点算术相关概念第28-32页
     ·高精度算术软件实现的研究现状第32-34页
     ·高精度算术处理器的研究现状第34-36页
     ·高精度算术 GPU 实现的研究现状第36-37页
     ·高精度算术 FPGA 实现的研究现状第37-38页
   ·主要工作和创新点第38-40页
   ·全文组织结构第40-42页
第二章 支持高精度运算的处理器体系结构第42-56页
   ·研究背景第42-46页
     ·超长指令字技术第43-44页
     ·相关工作第44-46页
   ·超长指令字模板描述第46-52页
     ·定制超长指令字模板结构第46-48页
     ·可配置多 VLIW 核体系结构第48-49页
     ·超长指令字代码压缩策略第49-52页
   ·基于 VLIW 模板算法加速器设计流程第52-55页
     ·基于 VLIW 模板算法加速器的设计流程第52-53页
     ·基于 VLIW 模板算法加速器的性能分析第53-55页
   ·本章总结第55-56页
第三章 基于全展开方法四精度精确向量内积算法与结构第56-86页
   ·LU 分解的计算精度损失模型第57-59页
   ·精确向量内积算法第59-64页
     ·相关工作第60-62页
     ·精确向量内积算法第62-64页
   ·精确向量内积实现结构第64-74页
     ·Quad-HPMAC 的总体结构第64-65页
     ·Quad-HPMAC 的优化策略第65-70页
     ·Quad-HPMAC 的性能分析及扩展分析第70-71页
     ·Quad-HPMAC 实验评测第71-74页
   ·基于 Quad-HPMAC 统一四精度矩阵运算加速器第74-83页
     ·细粒度矩阵运算并行算法第74-78页
     ·统一矩阵运算加速器的结构第78-80页
     ·统一矩阵运算加速器的性能分析第80-83页
   ·本章总结第83-86页
第四章 基于超长指令字模板统一基本函数计算模型与结构第86-110页
   ·研究背景第87-90页
     ·基本函数的特点第87-89页
     ·相关工作第89-90页
   ·统一基本函数计算模型第90-94页
     ·基本函数的硬件实现算法第90-93页
     ·统一基本函数计算模型第93-94页
   ·统一四精度基本函数处理器第94-105页
     ·统一四精度基本函数结构第94-97页
     ·四精度基本函数算法映射第97-104页
     ·统一双精度基本函数处理器的扩展第104-105页
   ·实验结果与性能分析第105-109页
     ·综合结果第105-106页
     ·四精度基本函数处理器性能比较第106-108页
     ·双精度基本函数处理器性能比较第108-109页
   ·本章总结第109-110页
第五章 基于超长指令字模板四精度算法加速器结构第110-132页
   ·空间轨道预测应用第111-114页
     ·SGP4/SDP4 模型第111-113页
     ·程序特征分析第113-114页
   ·基于 VLIW 模板算法加速器结构第114-119页
     ·四精度算法加速器结构第114-116页
     ·分支和循环优化策略第116-119页
   ·定制 VLIW 指令序列生成技术第119-127页
     ·基于贪婪思想的指令调度第121-123页
     ·存储空间分配第123-126页
     ·冲突检测第126-127页
   ·实验测评第127-130页
     ·综合结果第127-129页
     ·代码压缩率第129页
     ·性能比较第129-130页
   ·本章总结第130-132页
第六章 基于超长指令字模板任意精度算法加速器结构第132-160页
   ·研究背景第132-133页
   ·任意精度向量内积算法与结构第133-137页
     ·任意精度精确向量内积算法第134-135页
     ·任意精度精确向量内积结构第135-136页
     ·VPMAC 单元的性能分析第136-137页
   ·任意精度基本函数结构与实现第137-146页
     ·统一任意精度基本函数处理器结构第137-142页
     ·任意精度基本函数算法及映射第142-146页
   ·任意精度矩阵运算加速器结构第146-149页
     ·VPMAC 协处理器第146-149页
     ·统一任意精度矩阵运算加速器第149页
   ·实验评测第149-157页
     ·测试建立第150页
     ·PCI-E 通信带宽第150-151页
     ·VPMAC 模块的综合结果第151-152页
     ·VP_VELP 模块的综合结果及性能分析第152-153页
     ·任意精度矩阵加速器的实验评测第153-157页
   ·本章总结第157-160页
第七章 结论与展望第160-164页
   ·工作总结第160-161页
   ·工作展望第161-164页
致谢第164-166页
参考文献第166-182页
作者在学期间取得的学术成果第182-185页
作者在学期间参与的科研工作和所获专利第185页

论文共185页,点击 下载论文
上一篇:天基红外监视系统目标检测与跟踪技术研究
下一篇:片上网络无缓冲路由器关键技术研究