首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于FPGA的深度学习在图像识别上的优化与加速应用

摘要第5-6页
abstract第6-7页
第一章 绪论第10-19页
    1.1 课题研究背景与意义第10-11页
    1.2 国内外研究现状第11-17页
        1.2.1 深度学习算法模型量化第11-13页
        1.2.2 基于FPGA的深度学习算法移植第13-16页
        1.2.3 国内外研究存在的问题第16-17页
    1.3 主要工作及贡献第17页
    1.4 论文章节安排第17-19页
第二章 深度学习算法硬件加速理论第19-34页
    2.1 卷积神经网络基本结构第19-23页
        2.1.1 卷积层第19-20页
        2.1.2 池化层第20-21页
        2.1.3 激活函数第21-22页
        2.1.4 全连接层第22-23页
        2.1.5 Softmax函数第23页
        2.1.6 批归一化第23页
    2.2 模型量化理论第23-26页
        2.2.1 权值共享第24页
        2.2.2 权值精简第24-26页
    2.3 硬件选型第26-31页
        2.3.1 FPGA与 GPU性能对比第27-28页
        2.3.2 ZCU102 评估板简介第28-31页
    2.4 FPGA实现深度学习算法的挑战第31-33页
    2.5 本章小结第33-34页
第三章 深度学习算法在FPGA上的移植优化研究第34-57页
    3.1 引言第34页
    3.2 VGG-16 模型量化第34-37页
        3.2.1 VGG-16 模型简介第34-35页
        3.2.2 VGG-16 模型量化第35-37页
    3.3 基于HLS在 FPGA上的并行优化技术第37-44页
        3.3.1 HLS并行加速模型第38-40页
        3.3.2 HLS并行加速优化技术第40-44页
    3.4 基于FPGA的 VGG-16 算法移植设计第44-53页
        3.4.1 基于FPGA的深度学习算法加速架构第44-45页
        3.4.2 基于HLS的卷积层优化第45-50页
        3.4.3 基于HLS的全连接层优化第50-52页
        3.4.4 基于ZCU102 评估板的VGG-16 算法实现第52-53页
    3.5 结果与分析第53-56页
    3.6 本章小结第56-57页
第四章 二值深度学习算法在FPGA上的移植优化研究第57-71页
    4.1 引言第57页
    4.2 二值神经网络第57-63页
        4.2.1 神经网络模型参数二值化第57-58页
        4.2.2 Sign导函数优化第58-59页
        4.2.3 乘法优化第59-61页
        4.2.4 二值神经网络训练第61-63页
    4.3 基于FPGA的二值VGG算法移植第63-68页
        4.3.1 VGG二值化神经网络系统框架第63页
        4.3.2 二值VGG算法移植优化第63-68页
    4.4 结果与分析第68-70页
    4.5 本章小结第70-71页
第五章 总结与展望第71-72页
    5.1 全文总结第71页
    5.2 未来工作展望第71-72页
致谢第72-73页
参考文献第73-77页
附录第77-81页
攻硕期间取得的研究成果第81页

论文共81页,点击 下载论文
上一篇:宽带频控阵天线的设计研究
下一篇:未参保工伤患者社会支持网络研究--以德州市L区为例