首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

嵌入式深度神经网络的模型压缩与前向加速技术研究

摘要第5-6页
ABSTRACT第6-7页
第1章 绪论第10-16页
    1.1 课题研究背景及意义第10-11页
    1.2 国内外的研究现状第11-13页
        1.2.1 模型压缩第11-13页
        1.2.2 计算加速第13页
    1.3 本文研究内容第13-14页
    1.4 本文组织结构第14-16页
第2章 技术背影第16-32页
    2.1 人工神经元第16-19页
        2.1.1 人工神经元模型第16-17页
        2.1.2 激活函数第17-19页
    2.2 人工神经网络第19-24页
        2.2.1 网络结构模型第19-20页
        2.2.2 损失函数第20-21页
        2.2.3 训练方法第21-24页
    2.3 卷积神经网络第24-27页
        2.3.1 卷积层第24-26页
        2.3.2 池化层第26-27页
        2.3.3 全连接层第27页
    2.4 NEON优化第27-31页
        2.4.1 NEON寄存器第27-29页
        2.4.2 NEON指令简介第29-31页
    2.5 本章小结第31-32页
第3章 非对称三元权重量化研究第32-42页
    3.1 非对称三元权重量化方法第32-35页
        3.1.1 权重分析第32-33页
        3.1.2 量化方法第33-34页
        3.1.3 性能分析第34-35页
    3.2 非对称三元权重网络训练方法第35-37页
        3.2.1 算法描述第36-37页
        3.2.2 训练细节第37页
    3.3 非对称三元权重存储方法第37-40页
        3.3.1 量化存储原理第37-38页
        3.3.2 量化存储实现第38-40页
    3.4 本章小结第40-42页
第4章 低精度矩阵加速深度神经网络实现第42-54页
    4.1 神经网络低精度计算设计第42-44页
    4.2 基于NEON指令的矩阵乘法实现第44-48页
        4.2.1 浮点矩阵乘法NEON实现第44-47页
        4.2.2 8-bit定点整数矩阵乘法NEON实现第47-48页
    4.3 指令调度优化第48-50页
        4.3.1 指令流水线第48-50页
        4.3.2 指令重排优化第50页
    4.4 高速缓存优化第50-53页
    4.5 本章小结第53-54页
第5章 实验与分析第54-66页
    5.1 实验环境介绍第54页
    5.2 模型压缩实验第54-60页
        5.2.1 CIFAR-10数据集上的实验第55-57页
        5.2.2 ImageNet数据集上的实验第57-60页
    5.3 模型加速实验第60-64页
        5.3.1 矩阵乘法加速实验第60-61页
        5.3.2 神经网络加速实验第61-64页
    5.4 本章小结第64-66页
第6章 总结与展望第66-68页
    6.1 本文总结第66-67页
    6.2 未来展望第67-68页
参考文献第68-74页
致谢第74-76页
在读期间发表的学术论文与取得的其他研究成果第76页

论文共76页,点击 下载论文
上一篇:基于机器学习的模式识别技术及其医学应用探索
下一篇:贝叶斯高斯过程潜变量模型的研究与应用