首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--翻译机论文

基于短语的统计机器翻译模型训练中若干关键问题的研究

摘要第4-6页
Abstract第6-7页
第1章 绪论第14-34页
    1.1 统计机器翻译研究的背景及意义第14-16页
    1.2 统计机器翻译中的词对齐方法第16-23页
        1.2.1 基于序列的词对齐模型第17-19页
        1.2.2 基于繁殖率的词对齐模型第19-21页
        1.2.3 判别式词对齐方法第21-23页
        1.2.4 词对齐训练中可能产生的错误第23页
    1.3 统计机器翻译中的模型第23-28页
        1.3.1 语言模型第24-25页
        1.3.2 翻译模型第25-27页
        1.3.3 调序模型第27-28页
    1.4 统计机器翻译模型参数的调节第28-30页
        1.4.1 最小错误率训练算法第28-29页
        1.4.2 Online 判别式训练算法第29-30页
    1.5 统计机器翻译的解码第30-32页
        1.5.1 基于栈式搜索的解码算法第30-31页
        1.5.2 基于同步句法分析的解码算法第31-32页
    1.6 本文的主要研究内容第32-34页
第2章 双语语料的过滤及词对齐的改进第34-51页
    2.1 双语语料的过滤第34-38页
        2.1.1 句对齐错误对统计机器翻译的影响第34-35页
        2.1.2 语句的困惑度第35-36页
        2.1.3 对齐句对的困惑度第36-37页
        2.1.4 基于困惑度的训练语料过滤方法第37-38页
    2.2 基于 IBM 模型 4 的判别式词对齐第38-44页
        2.2.1 IBM 词对齐模型 4 概述第38-40页
        2.2.2 单向词对齐中的回收器现象第40-41页
        2.2.3 基于 IBM 模型 4 的判别式词对齐算法第41-44页
    2.3 实验及结果分析第44-50页
        2.3.1 数据准备第44页
        2.3.2 基于困惑度的训练语料过滤实验第44-47页
        2.3.3 基于 IBM 模型 4 的判别式词对齐实验第47-50页
    2.4 本章小结第50-51页
第3章 短语模型中的翻译规则抽取及过滤第51-67页
    3.1 词对齐上的短语抽取方法第51-54页
        3.1.1 严格短语与非严格短语第51-52页
        3.1.2 非严格短语的相似度约束第52-54页
    3.2 基于多种词对齐结果的短语表构建第54-58页
        3.2.1 单一词对齐结果上的短语频率统计第54-55页
        3.2.2 多种词对齐结果上的短语频率统计第55-57页
        3.2.3 基于多种词对齐结果的短语模型的特征第57-58页
    3.3 基于 Fisher 精确检验的短语过滤方法第58-62页
        3.3.1 Fisher 精确检验第58-60页
        3.3.2 用 p-value 过滤短语规则第60-61页
        3.3.3 p-value 的近似计算第61-62页
    3.4 实验及结果分析第62-66页
        3.4.1 非严格短语抽取实验第63-64页
        3.4.2 基于多种词对齐结果的短语抽取实验第64-66页
    3.5 本章小结第66-67页
第4章 基于句法标注序列的调序模型第67-87页
    4.1 词汇化调序模型第67-74页
        4.1.1 线性解码过程中的短语调序第67-68页
        4.1.2 基于短语的调序模型第68-71页
        4.1.3 基于短语的层次化调序模型第71-74页
    4.2 基于句法标注序列的调序模型第74-81页
        4.2.1 内置词性标注的短语模型第75-77页
        4.2.2 内置句法标注的短语模型第77-79页
        4.2.3 基于句法标注序列的调序模型第79-81页
    4.3 实验与结果分析第81-86页
        4.3.1 线性调序模型上的实验第81-83页
        4.3.2 层次化调序模型上的实验第83-86页
    4.4 本章小结第86-87页
第5章 基于强制解码的最小错误率训练第87-109页
    5.1 统计机器翻译中的最小错误率训练算法第87-92页
        5.1.1 统计机器翻译中的参数调节第87-88页
        5.1.2 最小错误率算法第88-92页
    5.2 解码算法第92-103页
        5.2.1 短语模型的解码算法第92-98页
        5.2.2 层次短语模型的解码算法第98-103页
    5.3 基于强制解码的最小错误率训练第103-106页
        5.3.1 解码算法中的强制解码特征第103-104页
        5.3.2 加入强制解码结果的最小错误率训练第104-106页
    5.4 实验与结果分析第106-108页
        5.4.1 短语模型上的参数调节实验第106-107页
        5.4.2 层次短语模型上的参数调节实验第107-108页
    5.5 本章小结第108-109页
结论第109-111页
参考文献第111-122页
攻读博士学位期间所发表的论文第122-124页
致谢第124-125页
个人简历第125页

论文共125页,点击 下载论文
上一篇:空间大容差末端执行器及其软捕获策略研究
下一篇:基于有源频率选择表面的电扫描天线研究