目录 | 第1-8页 |
表目录 | 第8-9页 |
图目录 | 第9-12页 |
摘要 | 第12-14页 |
Abstract | 第14-16页 |
第一章 绪论 | 第16-42页 |
·课题背景 | 第16-28页 |
·高精度计算的作用 | 第16-21页 |
·FPGA 可重构计算 | 第21-26页 |
·FPGA 实现高精度计算面临的挑战 | 第26-28页 |
·课题来源 | 第28页 |
·研究现状 | 第28-38页 |
·浮点算术相关概念 | 第28-32页 |
·高精度算术软件实现的研究现状 | 第32-34页 |
·高精度算术处理器的研究现状 | 第34-36页 |
·高精度算术 GPU 实现的研究现状 | 第36-37页 |
·高精度算术 FPGA 实现的研究现状 | 第37-38页 |
·主要工作和创新点 | 第38-40页 |
·全文组织结构 | 第40-42页 |
第二章 支持高精度运算的处理器体系结构 | 第42-56页 |
·研究背景 | 第42-46页 |
·超长指令字技术 | 第43-44页 |
·相关工作 | 第44-46页 |
·超长指令字模板描述 | 第46-52页 |
·定制超长指令字模板结构 | 第46-48页 |
·可配置多 VLIW 核体系结构 | 第48-49页 |
·超长指令字代码压缩策略 | 第49-52页 |
·基于 VLIW 模板算法加速器设计流程 | 第52-55页 |
·基于 VLIW 模板算法加速器的设计流程 | 第52-53页 |
·基于 VLIW 模板算法加速器的性能分析 | 第53-55页 |
·本章总结 | 第55-56页 |
第三章 基于全展开方法四精度精确向量内积算法与结构 | 第56-86页 |
·LU 分解的计算精度损失模型 | 第57-59页 |
·精确向量内积算法 | 第59-64页 |
·相关工作 | 第60-62页 |
·精确向量内积算法 | 第62-64页 |
·精确向量内积实现结构 | 第64-74页 |
·Quad-HPMAC 的总体结构 | 第64-65页 |
·Quad-HPMAC 的优化策略 | 第65-70页 |
·Quad-HPMAC 的性能分析及扩展分析 | 第70-71页 |
·Quad-HPMAC 实验评测 | 第71-74页 |
·基于 Quad-HPMAC 统一四精度矩阵运算加速器 | 第74-83页 |
·细粒度矩阵运算并行算法 | 第74-78页 |
·统一矩阵运算加速器的结构 | 第78-80页 |
·统一矩阵运算加速器的性能分析 | 第80-83页 |
·本章总结 | 第83-86页 |
第四章 基于超长指令字模板统一基本函数计算模型与结构 | 第86-110页 |
·研究背景 | 第87-90页 |
·基本函数的特点 | 第87-89页 |
·相关工作 | 第89-90页 |
·统一基本函数计算模型 | 第90-94页 |
·基本函数的硬件实现算法 | 第90-93页 |
·统一基本函数计算模型 | 第93-94页 |
·统一四精度基本函数处理器 | 第94-105页 |
·统一四精度基本函数结构 | 第94-97页 |
·四精度基本函数算法映射 | 第97-104页 |
·统一双精度基本函数处理器的扩展 | 第104-105页 |
·实验结果与性能分析 | 第105-109页 |
·综合结果 | 第105-106页 |
·四精度基本函数处理器性能比较 | 第106-108页 |
·双精度基本函数处理器性能比较 | 第108-109页 |
·本章总结 | 第109-110页 |
第五章 基于超长指令字模板四精度算法加速器结构 | 第110-132页 |
·空间轨道预测应用 | 第111-114页 |
·SGP4/SDP4 模型 | 第111-113页 |
·程序特征分析 | 第113-114页 |
·基于 VLIW 模板算法加速器结构 | 第114-119页 |
·四精度算法加速器结构 | 第114-116页 |
·分支和循环优化策略 | 第116-119页 |
·定制 VLIW 指令序列生成技术 | 第119-127页 |
·基于贪婪思想的指令调度 | 第121-123页 |
·存储空间分配 | 第123-126页 |
·冲突检测 | 第126-127页 |
·实验测评 | 第127-130页 |
·综合结果 | 第127-129页 |
·代码压缩率 | 第129页 |
·性能比较 | 第129-130页 |
·本章总结 | 第130-132页 |
第六章 基于超长指令字模板任意精度算法加速器结构 | 第132-160页 |
·研究背景 | 第132-133页 |
·任意精度向量内积算法与结构 | 第133-137页 |
·任意精度精确向量内积算法 | 第134-135页 |
·任意精度精确向量内积结构 | 第135-136页 |
·VPMAC 单元的性能分析 | 第136-137页 |
·任意精度基本函数结构与实现 | 第137-146页 |
·统一任意精度基本函数处理器结构 | 第137-142页 |
·任意精度基本函数算法及映射 | 第142-146页 |
·任意精度矩阵运算加速器结构 | 第146-149页 |
·VPMAC 协处理器 | 第146-149页 |
·统一任意精度矩阵运算加速器 | 第149页 |
·实验评测 | 第149-157页 |
·测试建立 | 第150页 |
·PCI-E 通信带宽 | 第150-151页 |
·VPMAC 模块的综合结果 | 第151-152页 |
·VP_VELP 模块的综合结果及性能分析 | 第152-153页 |
·任意精度矩阵加速器的实验评测 | 第153-157页 |
·本章总结 | 第157-160页 |
第七章 结论与展望 | 第160-164页 |
·工作总结 | 第160-161页 |
·工作展望 | 第161-164页 |
致谢 | 第164-166页 |
参考文献 | 第166-182页 |
作者在学期间取得的学术成果 | 第182-185页 |
作者在学期间参与的科研工作和所获专利 | 第185页 |