首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--人工神经网络与计算论文

GPU平台上循环神经网络训练算法设计与优化

摘要第5-6页
ABSTRACT第6-7页
第1章 绪论第15-23页
    1.1 引言第15-16页
    1.2 研究背景第16-20页
        1.2.1 神经网络第16-18页
        1.2.2 循环神经网络在自然语言处理领域的应用第18页
        1.2.3 GPU平台第18-20页
    1.3 本文研究问题及研究意义第20页
        1.3.1 针对不同应用模型进行优化的挑战第20页
        1.3.2 循环神经网络在GPU上优化加速的挑战第20页
    1.4 本文主要工作第20-21页
    1.5 本文组织结构第21-23页
第2章 相关研究工作第23-33页
    2.1 循环神经网络第23-26页
        2.1.1 长短时记忆模型第24-25页
        2.1.2 门控循环模型第25-26页
    2.2 循环神经网络相关算法第26-28页
        2.2.1 参数更新算法第26-28页
        2.2.2 大规模循环神经网络模型训练算法第28页
    2.3 循环神经网络并行计算加速方法第28-29页
    2.4 深度学习开源框架第29-31页
    2.5 本章小结第31-33页
第3章 基于循环神经网络的语音识别算法实现第33-45页
    3.1 语音识别第33-35页
        3.1.1 语音识别模型第34页
        3.1.2 评估算法第34-35页
    3.2 基于语音识别的数据组织算法实现第35-38页
    3.3 层规范化提升训练准确率第38-40页
    3.4 实验结果与分析第40-43页
        3.4.1 实验模型及数据第40页
        3.4.2 数据组织算法实验结果第40-42页
        3.4.3 层规范化实验结果第42-43页
    3.5 本章小结第43-45页
第4章 基于循环神经网络的机器翻译并行翻译算法实现第45-51页
    4.1 机器翻译第45-47页
        4.1.1 神经机器翻译模型第45-46页
        4.1.2 评估算法第46-47页
    4.2 机器翻译模型多句并行翻译第47-49页
    4.3 实验结果与分析第49-50页
        4.3.1 实验模型及数据第49页
        4.3.2 实验结果第49-50页
    4.4 本章小结第50-51页
第5章 循环神经网络在GPU平台上的算法优化第51-71页
    5.1 GPU在神经网络中的应用第51-54页
        5.1.1 GPU编程模型第52-53页
        5.1.2 不同架构GPU性能对比第53-54页
    5.2 基于GPU显存优化加速第54-58页
        5.2.1 算法实现第54-56页
        5.2.2 实验结果与分析第56-58页
    5.3 CUDA内核代码重构第58-62页
        5.3.1 算法实现第58-62页
        5.3.2 实验结果与分析第62页
    5.4 低比特量化方法模拟混合精度训练第62-69页
        5.4.1 低比特量化背景及意义第62-63页
        5.4.2 低比特量化方法第63-65页
        5.4.3 低比特量化实现第65-67页
        5.4.4 实验结果与分析第67-69页
    5.5 本章小结第69-71页
第6章 总结与展望第71-73页
    6.1 工作总结第71-72页
    6.2 本文创新点第72页
    6.3 未来工作展望第72-73页
参考文献第73-77页
致谢第77-79页
在读期间发表的学术论文与取得的研究成果第79-81页
在读期间参与的科研项目第81页

论文共81页,点击 下载论文
上一篇:三支概念格的属性约简方法研究
下一篇:基于FBG的机器人触须阵列感知机理及实验研究