首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

深度学习的硬件实现与优化技术研究

摘要第4-5页
Abstract第5-6页
第1章 绪论第9-15页
    1.1 课题背景及研究的目的和意义第9-10页
    1.2 国内外研究现状及分析第10-13页
        1.2.1 深度学习的发展概况第10-12页
        1.2.2 深度学习实现技术现状及分析第12-13页
    1.3 本文的主要研究内容第13-15页
第2章 深度学习硬件实现总体方案设计第15-29页
    2.1 深度学习理论分析第15-19页
    2.2 卷积神经网络拓扑结构第19-25页
        2.2.1 卷积层结构第20-23页
        2.2.2 抽样层结构第23-25页
        2.2.3 全连接层结构第25页
    2.3 系统总体方案设计第25-28页
    2.4 本章小结第28-29页
第3章 算法硬件移植的优化技术与架构设计第29-43页
    3.1 硬件平台选择第29-30页
    3.2 优化技术研究第30-34页
        3.2.1 并行技术第30-32页
        3.2.2 乒乓技术第32-33页
        3.2.3 复用技术第33-34页
        3.2.4 分块技术第34页
    3.3 卷积神经网络并行架构设计第34-41页
        3.3.1 不同层之间的并行架构第35-36页
        3.3.2 特征映射图之间的并行架构第36-38页
        3.3.3 特征映射图内部的并行架构第38-40页
        3.3.4 卷积运算的并行架构第40-41页
        3.3.5 其他形式的并行架构第41页
    3.4 本章小结第41-43页
第4章 卷积神经网络的硬件设计与实现第43-61页
    4.1 网络整体架构设计第43-44页
    4.2 卷积运算模块第44-56页
        4.2.1 Z型卷积运算模块第45-51页
        4.2.2 树型卷积运算模块第51-56页
    4.3 抽样运算模块第56-58页
    4.4 激活函数模块第58-59页
    4.5 缓存结构第59-60页
    4.6 本章小结第60-61页
第5章 实验验证与分析第61-71页
    5.1 实验平台搭建第61-65页
        5.1.1 实验环境介绍第61-62页
        5.1.2 实验样本集与网络结构第62-63页
        5.1.3 异构平台搭建第63-65页
    5.2 对比实验与识别性能分析第65-68页
    5.3 各模块资源使用与功耗分析第68-70页
    5.4 本章小结第70-71页
结论第71-73页
参考文献第73-77页
攻读硕士学位期间发表的论文及其它成果第77-79页
致谢第79页

论文共79页,点击 下载论文
上一篇:基于电流型控制的光伏并联系统离并网无缝切换技术
下一篇:电热联合系统潮流及最优潮流研究