首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--人工神经网络与计算论文

约束优化在神经机器翻译中的应用研究

摘要第4-6页
Abstract第6-7页
1 绪论第13-21页
    1.1 研究背景第13-16页
    1.2 研究现状第16-18页
        1.2.1 面向参数学习的约束优化第16-17页
        1.2.2 面向先验信息的约束优化第17-18页
    1.3 论文的主要研究内容第18-19页
    1.4 论文的组织结构第19-21页
2 背景知识第21-33页
    2.1“编码器-解码器-注意力机制”框架第21-25页
        2.1.1“编码器-解码器”结构第21-23页
        2.1.2 注意力机制第23-25页
    2.2 主流的神经机器翻译模型第25-28页
        2.2.1 基于条件门控制循环神经元(cGRU)的模型第25-26页
        2.2.2 基于多头注意力机制的模型(Transformer)第26-28页
    2.3 神经机器翻译模型训练和推断第28-31页
        2.3.1 词表处理第28-29页
        2.3.2 模型训练第29-30页
        2.3.3 模型推断第30-31页
    2.4 本章小结第31-33页
3 一种利用检查点进行约束的神经机器翻译训练方法第33-47页
    3.1 引言第33-34页
    3.2 相关工作第34-36页
        3.2.1 NMT训练中的正则化第34-35页
        3.2.2 在线知识蒸馏第35-36页
    3.3 利用检查点的在线蒸馏技术第36-39页
        3.3.1 NMT中的知识蒸馏技术第36-37页
        3.3.2 利用最好检查点进行在线知识蒸馏第37-38页
        3.3.3 利用平均检查点进行在线知识蒸馏第38-39页
    3.4 实验第39-43页
        3.4.1 实验设置第39-41页
        3.4.2 汉语-英语翻译对上的结果第41-42页
        3.4.3 在低资源数据集上的结果第42-43页
    3.5 实验分析第43-46页
        3.5.1 ODC方法对过拟合问题的影响第43-45页
        3.5.2 ODC方法对模型参数的“宽度”的影响第45-46页
    3.6 本章小结第46-47页
4 一种基于成分共享的神经机器翻译约束优化方法第47-61页
    4.1 引言第47-48页
    4.2 相关工作第48-49页
        4.2.1 参数共享第48-49页
        4.2.2 跨语言表示第49页
    4.3 方法框架第49-53页
        4.3.1 参数共享约束第49-50页
        4.3.2 表示共享约束第50-52页
        4.3.3 动态约束机制第52-53页
    4.4 实验第53-58页
        4.4.1 实验设置第53-54页
        4.4.2 NIST汉语-英语数据集结果第54-56页
        4.4.3 日语-英语、韩语-英语数据集上结果第56页
        4.4.4 共享表示检验第56-57页
        4.4.5 消融实验第57-58页
    4.5 本章小结第58-61页
5 总结与展望第61-63页
    5.1 本文的贡献第61页
    5.2 未来的研究方向第61-63页
致谢第63-65页
参考文献第65-73页
简历与科研成果第73-74页

论文共74页,点击 下载论文
上一篇:指关节炎超声图像的智能诊断研究
下一篇:中等收入阶段中国人力资本发展问题研究