首页--工业技术论文--无线电电子学、电信技术论文--基本电子电路论文--数字电路论文

基于FPGA的大规模浮点矩阵乘加速器研究

摘要第9-10页
ABSTRACT第10页
第一章 绪论第12-19页
    1.1 论文研究背景第12-13页
        1.1.1 选题背景第12-13页
        1.1.2 研究意义第13页
    1.2 国内外研究现状第13-17页
        1.2.1 浮点运算部件研究现状第13-14页
        1.2.2 矩阵乘法硬件加速第14-17页
    1.3 本文主要工作及创新点第17-18页
    1.4 论文结构第18-19页
第二章 基于FPGA的矩阵乘并行加速基础第19-31页
    2.1 矩阵乘分块算法第19-22页
        2.1.1 矩阵乘算法概述第19-20页
        2.1.2 串行分块算法第20-21页
        2.1.3 并行分块算法第21-22页
    2.2 矩阵乘并行结构第22-25页
        2.2.1 Systolic阵列结构第22-23页
        2.2.2 基于总线广播的并行结构第23-24页
        2.2.3 基于Systolic的拓展并行结构第24-25页
    2.3 加速器通信模式第25-27页
        2.3.1 基本通信模式第25-26页
        2.3.2 AXI总线通信协议第26-27页
    2.4 可编程片上系统第27-30页
        2.4.1 可编程片上系统技术发展与特点第28-29页
        2.4.2 可编程片上系统设计流程第29-30页
    2.5 本章小结第30-31页
第三章 基于FPGA的浮点矩阵乘加速器系统设计与优化第31-42页
    3.1 矩阵乘法加速方案及结构设计第31-32页
    3.2 浮点乘法累加器结构设计第32-37页
        3.2.1 工作流程第32-33页
        3.2.2 模块设计第33-37页
    3.3 DMA访存模块结构设计第37-41页
        3.3.1 读通道第38-40页
        3.3.2 写通道第40-41页
    3.4 本章小结第41-42页
第四章 面向应用的优化分块技术第42-54页
    4.1 非均匀矩阵乘应用背景第42-43页
    4.2 优化分块技术实现第43-49页
        4.2.1 确定可优化条件第44-45页
        4.2.2 建立目标函数第45-48页
        4.2.3 求解最优分块第48-49页
    4.3 优化分块技术硬件支持第49-53页
        4.3.1 可变分块值的支持第50-51页
        4.3.2 阶段同步模块第51-53页
    4.4 本章小结第53-54页
第五章 矩阵乘加速器实现与性能评测第54-65页
    5.1 实验环境第54-55页
        5.1.1 软件平台第54页
        5.1.2 硬件平台第54-55页
    5.2 硬件资源开销第55-57页
        5.2.1 DMA访存模块第55-56页
        5.2.2 浮点乘累加器第56-57页
    5.3 性能分析第57-64页
        5.3.1 DMA访存模块第57-58页
        5.3.2 浮点乘法累加器第58-59页
        5.3.3 矩阵乘加速器第59-63页
        5.3.4 优化分块技术第63-64页
    5.4 本章小结第64-65页
第六章 结束语第65-67页
    6.1 工作总结第65-66页
    6.2 研究展望第66-67页
致谢第67-69页
参考文献第69-73页
作者在学期间取得的学术成果第73页

论文共73页,点击 下载论文
上一篇:基于石墨烯材料的太赫兹天线技术研究
下一篇:幼儿园自制玩教具观念调查的研究--以镇江市D区为例