首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于TVM的循环神经网络的嵌入式平台部署与加速优化研究

摘要第4-5页
Abstract第5页
第1章 绪论第12-18页
    1.1 研究背景和意义第12-13页
    1.2 国内外研究现状第13-16页
        1.2.1 工业界的开源框架第13页
        1.2.2 应用场景第13-14页
        1.2.3 相关工作第14-16页
    1.3 论文主要结构第16-18页
第2章 主要技术基础第18-29页
    2.1 循环神经网络第18-23页
        2.1.1 神经元模型第18-19页
        2.1.2 多层神经网络模型第19页
        2.1.3 循环神经网络模型第19-23页
    2.2 计算图(Computational Graph)第23-25页
        2.2.1 计算图的基本思想第23页
        2.2.2 计算图优化方法第23-25页
    2.3 MXNet、 NNVM、TVM简介第25-27页
        2.3.1 MXNet第25-26页
        2.3.2 NNVM第26-27页
        2.3.3 TVM第27页
    2.4 MXNet、 TVM、NNVM的关系第27-28页
    2.5 本章小结第28-29页
第3章 循环神经网络模型的计算图获取第29-35页
    3.1 语言模型第29-33页
        3.1.1 算法流程第29-31页
        3.1.2 具体模型参数与训练第31-32页
        3.1.3 MXNet计算图分析第32-33页
    3.2 NNVM下计算图转化并进行符号融合第33页
    3.3 TVM下计算图的编译与最终部署第33-34页
    3.4 本章小结第34-35页
第4章 循环神经网络计算图模型的优化方案第35-42页
    4.1 针对计算图整体优化第35-37页
        4.1.1 针对循环神经网络计算图的时间展开优化方案第35-36页
        4.1.2 针对LSTM结构单元的计算图优化第36-37页
    4.2 针对特定符号操作优化第37-41页
        4.2.1 数据分块第37-38页
        4.2.2 数据分块多线程模式第38-39页
        4.2.3 向量化第39-40页
        4.2.4 数据重组第40页
        4.2.5 使用矩阵库第40-41页
    4.3 本章小结第41-42页
第5章 实验与实验结果第42-56页
    5.1 台式机端优化实验第42-48页
        5.1.1 实验环境第42-43页
        5.1.2 实验步骤第43-44页
        5.1.3 实验结果第44-48页
        5.1.4 实验评价第48页
    5.2 树莓派方案(基于linux的嵌入式开发板)第48-52页
        5.2.1 实验环境第48-50页
        5.2.2 树莓派系统第50页
        5.2.3 实验步骤第50-51页
        5.2.4 实验结果第51页
        5.2.5 实验评价第51-52页
    5.3 智能手机方案第52-55页
        5.3.1 实验环境第52页
        5.3.2 实验步骤第52-54页
        5.3.3 实验结果第54-55页
        5.3.4 实验评价第55页
    5.4 本章小结第55-56页
第6章 总结与展望第56-58页
    6.1 论文工作总结第56页
    6.2 论文研究展望第56-58页
参考文献第58-61页
攻读硕士学位期间主要的研究成果第61-62页
致谢第62页

论文共62页,点击 下载论文
上一篇:高分辨率遥感影像不透水面提取算法研究
下一篇:基于卷积神经网络的关系抽取研究