首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

卷积神经网络加速器的实现与优化

摘要第5-7页
ABSTRACT第7-8页
第1章 绪论第15-23页
    1.1 课题背景及意义第15-16页
    1.2 相关工作第16-21页
    1.3 本文的主要工作第21-22页
    1.4 论文组织安排第22-23页
第2章 相关基础介绍第23-41页
    2.1 深度学习简介第23-33页
        2.1.1 基本概念第23-25页
        2.1.2 基本单元第25页
        2.1.3 正向传播与反向传播第25-27页
        2.1.4 常见深度学习网络模型第27-33页
    2.2 硬件加速相关技术简介第33-39页
        2.2.1 硬件加速平台第33-34页
        2.2.2 FPGA芯片原理第34页
        2.2.3 FPGA芯片架构第34-35页
        2.2.4 软硬件协同设计第35-38页
        2.2.5 常用优化技术第38-39页
    2.3 本章小结第39-41页
第3章 采用流水线方式运行的高能效CNN加速器第41-63页
    3.1 研究动机第41-43页
    3.2 基本思路第43页
    3.3 总体框架第43-54页
        3.3.1 卷积层的设计与优化第45-48页
        3.3.2 池化层的设计与优化第48-49页
        3.3.3 全连接层的设计与优化第49-52页
        3.3.4 设计空间搜索第52-54页
    3.4 编程模型第54-56页
    3.5 实验评估第56-62页
        3.5.1 硬件实现平台第56-58页
        3.5.2 CPU与GPU平台第58-59页
        3.5.3 与CPU平台和GPU平台的比较第59-60页
        3.5.4 与已有加速器的比较第60-62页
    3.6 本章小结第62-63页
第4章 采用统一的处理引擎计算卷积神经网络的加速器第63-71页
    4.1 UniCNN加速器的设计第63-67页
        4.1.1 动机与思路第63页
        4.1.2 卷积层的设计第63-64页
        4.1.3 全连接层的设计第64-65页
        4.1.4 流水线设计第65-66页
        4.1.5 总体框架第66-67页
    4.2 编程模型第67-68页
    4.3 实验评估第68-70页
        4.3.1 与CPU平台和GPU平台的比较第68-69页
        4.3.2 与已有加速器的比较第69-70页
    4.4 本章小结第70-71页
第5章 总结与展望第71-73页
    5.1 本文总结第71页
    5.2 未来展望第71-73页
参考文献第73-79页
致谢第79-81页
在读期间发表的学术论文与取得的研究成果第81-82页

论文共82页,点击 下载论文
上一篇:基于FPGA实时预测控制策略的研究以及在开关电源中应用
下一篇:城市短期交通流量预测