首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--人工神经网络与计算论文

基于FPGA的卷积神经网络加速器

摘要第4-5页
Abstract第5页
第1章 绪论第10-15页
    1.1 课题背景第10-11页
    1.2 研究现状第11-13页
        1.2.1 硬件加速平台第11-12页
        1.2.2 加速平台现状第12-13页
    1.3 论文创新点第13页
    1.4 论文的组织结构第13-15页
第2章 神经网络理论基础第15-25页
    2.1 基本概念第15-18页
        2.1.1 神经元结构第15-17页
        2.1.2 神经网络拓扑第17-18页
    2.2 学习算法第18-22页
        2.2.1 BP算法第19-20页
        2.2.2 BPTT算法第20-22页
    2.3 神经网络类型第22-24页
        2.3.1 深度神经网络第22页
        2.3.2 卷积神经网络第22-23页
        2.3.3 LSTM网络第23-24页
    2.4 本章小节第24-25页
第3章 算法分析第25-36页
    3.1 卷积神经网络前向算法分析第25-28页
        3.1.1 卷积层计算分析第26-27页
        3.1.2 池化层计算分析第27-28页
    3.2 卷积神经网络反向算法分析第28-33页
        3.2.1 误差传播与权重梯度第29-30页
        3.2.2 前向与反向传播归一化第30-33页
    3.3 传统计算核心的问题第33-35页
    3.4 本章小节第35-36页
第4章 基于FPGA的加速器设计第36-51页
    4.1 工具链介绍第36-37页
    4.2 加速器整体架构第37-41页
        4.2.1 加速器横向结构第38-39页
        4.2.2 加速器纵向结构第39-41页
    4.3 计算核心优化第41-45页
        4.3.1 输入输出级优化第41页
        4.3.2 浮点数运算优化第41-42页
        4.3.3 卷积运算与池化运算同构化第42-45页
    4.4 稀疏特征图优化第45-49页
        4.4.1 压缩格式第46-47页
        4.4.2 解码模块第47-49页
    4.5 本章小节第49-51页
第5章 实验分析第51-59页
    5.1 实验平台第51-52页
    5.2 乘加树结构与镜像树结构对比第52-53页
        5.2.1 资源及利用率对比第52-53页
        5.2.2 不同输入通道计算性能对比第53页
    5.3 支持稀疏特征图的加速器性能分析第53-57页
        5.3.1 存储空间与稀疏度第54-55页
        5.3.2 计算性能与稀疏度第55-57页
    5.4 不同加速器性能对比第57-58页
    5.5 本章小节第58-59页
第6章 总结与展望第59-61页
    6.1 总结第59-60页
    6.2 展望第60-61页
参考文献第61-64页
致谢第64-65页
在读期间发表的论文与成果第65页

论文共65页,点击 下载论文
上一篇:基于FPGA加速的细胞神经网络在医学图像分割中的应用
下一篇:基于能力储备的中心支撑钢框架结构抗震性能研究