首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--人工神经网络与计算论文

面向TTA架构ASIP设计的深度神经网络优化

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第10-16页
    1.1 课题研究背景第10-12页
    1.2 课题研究内容第12-13页
    1.3 国内外研究现状第13-14页
    1.4 论文组织结构第14-15页
    1.5 本章小结第15-16页
第二章 相关理论介绍第16-28页
    2.1 神经网络的模型结构发展第16-19页
        2.1.1 LeNet-5与卷积神经网络的起源第16页
        2.1.2 AlexNet与深度学习的崛起第16-17页
        2.1.3 不断刷新纪录的新模型结构第17-19页
    2.2 卷积神经网络的常用结构第19-22页
        2.2.1 卷积层第19-20页
        2.2.2 归一化层第20-21页
        2.2.3 池化层第21页
        2.2.4 激活层第21-22页
    2.3 神经网络的优化技术第22-24页
        2.3.1 神经网络的压缩第22-24页
        2.3.2 神经网络的加速第24页
    2.4 TTA架构的主要特点第24-26页
    2.5 本章小结第26-28页
第三章 神经网络的量化方案设计第28-38页
    3.1 量化方案的整体思路第28-31页
    3.2 量化方案的具体实现第31-37页
        3.2.1 权重的对称仿射量化第31-32页
        3.2.2 近似的批量归一化第32-35页
        3.2.3 激活层与激活值的量化第35-36页
        3.2.4 变精度的梯度量化第36-37页
    3.3 本章小结第37-38页
第四章 神经网络的加速方案设计第38-56页
    4.1 乘法结合律与量化卷积第38-45页
        4.1.1 量化神经网络的前向传播第38-39页
        4.1.2 量化卷积的原理第39-42页
        4.1.3 量化卷积核的表示第42-45页
    4.2 面向TTA架构的量化卷积功能单元第45-51页
        4.2.1 卷积核的分块第45-46页
        4.2.2 卷积运算的循环展开第46-49页
        4.2.3 前向传播的数据交换第49-51页
    4.3 基于TTA架构的神经网络加速器第51-53页
    4.4 本章小结第53-56页
第五章 实验结果与分析第56-68页
    5.1 近似批量归一化的实验第56-58页
        5.1.1 AlexNet-BN模型上的实验第56-57页
        5.1.2 ResNet-18模型上的实验第57-58页
    5.2 量化方案的实验第58-62页
        5.2.1 SVHN数据集上的实验第58-59页
        5.2.2 CIFAR-10数据集上的实验第59-61页
        5.2.3 ImageNet数据集上的实验第61-62页
    5.3 量化卷积功能单元的实验第62-65页
        5.3.1 实验配置第62-63页
        5.3.2 资源占用的对比第63-64页
        5.3.3 片上功率的对比第64-65页
    5.4 本章小结第65-68页
第六章 总结与展望第68-70页
    6.1 本文工作总结第68-69页
    6.2 不足与展望第69-70页
参考文献第70-74页
致谢第74-76页
攻读学位期间发表的学术论文目录第76页

论文共76页,点击 下载论文
上一篇:软件定义无线传感网的双信道架构研究
下一篇:基于深度学习的医学影像分析与标注