嵌入式深度神经网络的模型压缩与前向加速技术研究

摘要	第5-6页
ABSTRACT	第6-7页
第1章绪论	第10-16页
1.1 课题研究背景及意义	第10-11页
1.2 国内外的研究现状	第11-13页
1.2.1 模型压缩	第11-13页
1.2.2 计算加速	第13页
1.3 本文研究内容	第13-14页
1.4 本文组织结构	第14-16页
第2章技术背影	第16-32页
2.1 人工神经元	第16-19页
2.1.1 人工神经元模型	第16-17页
2.1.2 激活函数	第17-19页
2.2 人工神经网络	第19-24页
2.2.1 网络结构模型	第19-20页
2.2.2 损失函数	第20-21页
2.2.3 训练方法	第21-24页
2.3 卷积神经网络	第24-27页
2.3.1 卷积层	第24-26页
2.3.2 池化层	第26-27页
2.3.3 全连接层	第27页
2.4 NEON优化	第27-31页
2.4.1 NEON寄存器	第27-29页
2.4.2 NEON指令简介	第29-31页
2.5 本章小结	第31-32页
第3章非对称三元权重量化研究	第32-42页
3.1 非对称三元权重量化方法	第32-35页
3.1.1 权重分析	第32-33页
3.1.2 量化方法	第33-34页
3.1.3 性能分析	第34-35页
3.2 非对称三元权重网络训练方法	第35-37页
3.2.1 算法描述	第36-37页
3.2.2 训练细节	第37页
3.3 非对称三元权重存储方法	第37-40页
3.3.1 量化存储原理	第37-38页
3.3.2 量化存储实现	第38-40页
3.4 本章小结	第40-42页
第4章低精度矩阵加速深度神经网络实现	第42-54页
4.1 神经网络低精度计算设计	第42-44页
4.2 基于NEON指令的矩阵乘法实现	第44-48页
4.2.1 浮点矩阵乘法NEON实现	第44-47页
4.2.2 8-bit定点整数矩阵乘法NEON实现	第47-48页
4.3 指令调度优化	第48-50页
4.3.1 指令流水线	第48-50页
4.3.2 指令重排优化	第50页
4.4 高速缓存优化	第50-53页
4.5 本章小结	第53-54页
第5章实验与分析	第54-66页
5.1 实验环境介绍	第54页
5.2 模型压缩实验	第54-60页
5.2.1 CIFAR-10数据集上的实验	第55-57页
5.2.2 ImageNet数据集上的实验	第57-60页
5.3 模型加速实验	第60-64页
5.3.1 矩阵乘法加速实验	第60-61页
5.3.2 神经网络加速实验	第61-64页
5.4 本章小结	第64-66页
第6章总结与展望	第66-68页
6.1 本文总结	第66-67页
6.2 未来展望	第67-68页
参考文献	第68-74页
致谢	第74-76页
在读期间发表的学术论文与取得的其他研究成果	第76页