首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

一种高性能CNN专用卷积加速器的设计与实现

摘要第4-6页
Abstract第6-7页
第一章 绪论第13-27页
    1.1 研究背景第13-26页
        1.1.1 引言第13-14页
        1.1.2 卷积神经网络基础概念第14-16页
        1.1.3 AlexNet第16-17页
        1.1.4 技术趋势第17-21页
        1.1.5 主流计算平台第21-26页
    1.2 论文的组织结构第26页
    1.3 课题来源第26-27页
第二章 专用卷积加速器的设计第27-38页
    2.1 卷积层并行性分析第27-30页
    2.2 专用数据结构第30-33页
    2.3 整体架构第33-37页
        2.3.1 系统整体架构与工作流程第33-34页
        2.3.2 主要模块与功能第34-37页
    2.4 本章小结第37-38页
第三章 卷积加速器的具体实现第38-60页
    3.1 主控制器模块第38-41页
    3.2 存储选通模块第41-42页
    3.3 DMA端口模块第42-46页
    3.4 地址生成模块第46-50页
    3.5 存储交互模块第50-52页
    3.6 计算阵列第52-53页
    3.7 累加器模块第53-55页
    3.8 可重构MAC单元第55-59页
    3.9 本章小结第59-60页
第四章 验证与性能分析第60-69页
    4.1 FPGA开发环境第60-61页
    4.2 功能验证第61-62页
    4.3 FPGA实现结果与性能分析第62-68页
        4.3.1 AlexNet第62-65页
        4.3.2 性能分析第65-68页
    4.4 本章小结第68-69页
第五章 总结与展望第69-71页
    5.1 工作总结第69-70页
    5.2 工作展望第70-71页
参考文献第71-74页
硕士期间参与的项目及主要成果第74-75页
致谢第75-76页

论文共76页,点击 下载论文
上一篇:基于事件的强化学习及其在室内导航中的应用
下一篇:基于声表面波技术对液体混合的研究