首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--人工神经网络与计算论文

基于FPGA总线框架的深度卷积神经网络加速器关键技术研究

摘要第10-11页
ABSTRACT第11页
第一章 前言第13-23页
    1.1 课题研究背景第13-14页
    1.2 课题研究现状第14-20页
        1.2.1 定点化运算研究现状第14-16页
        1.2.2 高级综合设计技术研究现状第16-17页
        1.2.3 AXI4协议现状第17-20页
    1.3 课题研究内容第20-21页
        1.3.1 CNN算法的定点化分析第20-21页
        1.3.2 基于HLS的优化设计技术第21页
        1.3.3 基于AXI的优化设计技术第21页
    1.4 论文组织结构第21-23页
第二章 CNN算法定点化方法第23-28页
    2.1 定点化技术第23-24页
    2.2 CNN定点化模型及仿真技术第24页
    2.3 软件仿真平台及仿真结果第24-28页
第三章 基于HLS的优化设计技术第28-45页
    3.1 HLS设计方法第28-30页
    3.2 基于HLS的LeNet算法结构第30-40页
        3.2.1 LeNet算法第30-31页
        3.2.2 加速器体系结构设计第31-35页
        3.2.3 卷积算法核设计第35-40页
    3.3 加速器实现第40-45页
        3.3.1 LeNet加速器的实现结果及分析第40-42页
        3.3.2 卷积算法核的实现对比第42-45页
第四章 基于AXI的优化设计技术第45-69页
    4.1 面向DCNN的全流水加速结构第45-47页
        4.1.1 CNN加速方法分析第45-46页
        4.1.2 全流水加速器设计第46-47页
    4.2 FPGA总线框架顶层设计第47-48页
    4.3 AXI设计方法第48-63页
        4.3.1 CreateBlockDesign设计流第49-50页
        4.3.2 CreateAXI4Peripheral设计流第50-55页
        4.3.3 AXI4/AXIS设计流程第55页
        4.3.4 定制AXI4Peripheral第55-63页
    4.4 基于AXI4的AlexNet体系结构及其实现第63-69页
        4.4.1 AlexNet体系结构分析第63-64页
        4.4.2 非框架结构的加速器实现结果第64页
        4.4.3 框架结构的加速器实现结果第64-69页
第五章 总结与展望第69-70页
    5.1 工作总结第69页
    5.2 研究展望第69-70页
致谢第70-71页
参考文献第71-76页
作者在学期间取得的学术成果第76页

论文共76页,点击 下载论文
上一篇:基于传感器的行为识别方法研究
下一篇:基于ROS的机器人行为协同开发框架研究与实现