首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--人工神经网络与计算论文

稀疏神经网络和稀疏神经网络加速器的研究

摘要第5-6页
Abstract第6-7页
第1章 绪论第11-25页
    1.1 神经网络技术的应用第11-16页
        1.1.1 神经网络技术发展历程第11-13页
        1.1.2 神经网络的应用和发展第13-16页
    1.2 神经网络计算平台发展第16-20页
        1.2.1 通用处理器CPU和GPU第16-17页
        1.2.2 FPGA第17-19页
        1.2.3 ASIC第19-20页
    1.3 神经网络技术面临的挑战和目前的解决方法第20-22页
        1.3.1 面临的挑战第20页
        1.3.2 目前的解决方法第20-21页
        1.3.3 稀疏神经网络的不规则性第21-22页
    1.4 主要研究内容及贡献第22-23页
    1.5 论文的组织结构第23-25页
第2章 神经网络技术简介第25-43页
    2.1 神经网络模型基础第25-32页
        2.1.1 全连接层第25-26页
        2.1.2 卷积层第26-27页
        2.1.3 池化层第27-28页
        2.1.4 归一化层第28-29页
        2.1.5 激活层第29-30页
        2.1.6 LSTM第30-31页
        2.1.7 GRU第31-32页
    2.2 神经网络模型的低能耗优化技术第32-36页
        2.2.1 神经网络的低精度计算第33-34页
        2.2.2 神经网络裁剪技术第34-35页
        2.2.3 权值矩阵变换第35-36页
    2.3 神经网络加速器第36-42页
        2.3.1 现有神经网络加速器架构第36-38页
        2.3.2 基于向量算子的神经网络处理器第38-40页
        2.3.3 基于乘加算子空间数据流的神经网络处理器第40页
        2.3.4 稀疏神经网络处理器第40-42页
    2.4 本章小结第42-43页
第3章 一种新的神经网络压缩方法第43-59页
    3.1 背景和动机第43-47页
        3.1.1 稀疏神经网络第43-44页
        3.1.2 权值编码第44-47页
        3.1.3 不规则性第47页
    3.2 局部收敛第47-48页
    3.3 压缩神经网络第48-55页
        3.3.1 粗粒度剪枝第48-54页
        3.3.2 局部量化第54-55页
        3.3.3 熵编码第55页
    3.4 压缩实验结果第55-58页
        3.4.1 压缩比第55-56页
        3.4.2 精度第56-57页
        3.4.3 不规则度第57页
        3.4.4 AlexNet网络详细压缩特性第57-58页
    3.5 本章小结第58-59页
第4章 粗粒度稀疏神经网络加速器第59-76页
    4.1 Cambricon-S的整体架构第59-60页
    4.2 设计原则第60-62页
    4.3 Cambricon-S的设计细节第62-70页
        4.3.1 稀疏处理第62-66页
        4.3.2 存储模块第66-68页
        4.3.3 控制第68-69页
        4.3.4 片上互联第69-70页
    4.4 编程模型第70-74页
        4.4.1 基于库的编程模型第70-71页
        4.4.2 编译器第71-73页
        4.4.3 循环分块第73-74页
    4.5 本章小结第74-76页
第5章 针对新型加速器的性能模拟器第76-85页
    5.1 背景第76-77页
    5.2 优化的模拟器第77-84页
        5.2.1 加速器的高层次抽象第78-79页
        5.2.2 事件分类第79-80页
        5.2.3 事件执行时间第80-82页
        5.2.4 事件的依赖关系第82页
        5.2.5 Simulator-O执行过程第82-84页
    5.3 Simulator-O的性能和准确度第84页
    5.4 本章小结第84-85页
第6章 实验方法和实验结果第85-95页
    6.1 实验方法第85-86页
        6.1.1 Baseline第85-86页
        6.1.2 Benchmark第86页
    6.2 实验结果第86-90页
        6.2.1 硬件属性第86-87页
        6.2.2 性能第87-89页
        6.2.3 能耗第89-90页
    6.3 讨论第90-94页
        6.3.1 熵编码和熵解码模块第90-91页
        6.3.2 稀疏度与性能第91-92页
        6.3.3 减少的不规则度第92页
        6.3.4 类似粗粒度稀疏的方法第92-93页
        6.3.5 其他稀疏神经网络加速器第93-94页
    6.4 本章小结第94-95页
第7章 总结和展望第95-98页
    7.1 本文工作总结第95-96页
    7.2 未来研究展望第96-98页
参考文献第98-110页
致谢第110-111页
在读期间发表的学术论文与取得的研究成果第111页

论文共111页,点击 下载论文
上一篇:面向云制造的物联网覆盖网研究
下一篇:基于介电泳的微粒操控系统的建模与控制