首页--工业技术论文--无线电电子学、电信技术论文--基本电子电路论文--数字电路论文

面向深度学习的FPGA硬件加速平台的研究

摘要第4-5页
abstract第5-6页
第一章 绪论第9-17页
    1.1 课题研究背景与意义第9-10页
    1.2 国内外研究现状与发展趋势第10-14页
    1.3 主要工作及贡献第14-15页
    1.4 论文的研究内容和组织结构第15-17页
第二章 相关技术基础第17-25页
    2.1 深度学习基础理论第17-20页
        2.1.1 人工神经元模型第17-19页
        2.1.2 神经网络第19-20页
    2.2 FPGA概述第20-21页
    2.3 硬件加速技术简介第21-24页
        2.3.1 GPU加速第21-22页
        2.3.2 FPGA加速第22-23页
        2.3.3 ASIC加速第23-24页
    2.4 本章小结第24-25页
第三章 基于FPGA的OpenCL编程模型第25-34页
    3.1 OpenCL基础第25-30页
        3.1.1 OpenCL平台模型第26页
        3.1.2 OpenCL执行模型第26-28页
        3.1.3 OpenCL存储模型第28-30页
    3.2 基于FPGA的OpenCL编程流程第30-31页
    3.3 基于FPGA的OpenCL编程优化第31-33页
    3.4 本章小结第33-34页
第四章 循环神经网络加速方案设计第34-44页
    4.1 循环神经网络模型推导第34-38页
    4.2 循环神经网络并行加速方案第38-40页
    4.3 循环神经网络加速系统架构设计第40-43页
    4.4 本章小结第43-44页
第五章 卷积神经网络加速方案设计第44-59页
    5.1 卷积神经网络基本理论与分析第44-52页
        5.1.1 卷积神经网络基本部件第44-48页
        5.1.2 卷积神经网络模型推导第48-52页
            5.1.2.1 推理阶段第48-50页
            5.1.2.2 训练阶段第50-52页
    5.2 卷积神经网络通用加速系统架构设计第52-55页
    5.3 基于通道的卷积神经网络加速方案第55-58页
    5.4 本章小结第58-59页
第六章 深度学习算法加速方案实现与结果第59-83页
    6.1 FPGA硬件加速平台介绍第59-61页
        6.1.1 硬件平台介绍第59-60页
        6.1.2 软件平台介绍第60-61页
    6.2 循环神经网络加速方案实验第61-68页
        6.2.1 实验方案第61页
        6.2.2 内核程序设计第61-67页
            6.2.2.1 推理阶段内核程序设计第61-63页
            6.2.2.2 训练阶段内核程序设计第63-67页
        6.2.3 循环神经网络加速方案实验结果第67-68页
    6.3 卷积神经网络加速方案实验第68-82页
        6.3.1 实验方案第68-70页
        6.3.2 通用内核程序设计第70-78页
            6.3.2.1 推理阶段内核程序设计第71-74页
            6.3.2.2 训练阶段内核程序设计第74-78页
        6.3.3 卷积神经网络加速方案实验结果第78-82页
    6.4 本章小结第82-83页
第七章 总结与展望第83-84页
致谢第84-85页
参考文献第85-89页
攻读硕士学位期间取得的成果第89页

论文共89页,点击 下载论文
上一篇:基于AMBA总线的CAN控制器的设计与验证
下一篇:无线传感器网络的节点移动算法研究