首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--翻译机论文

统计机器翻译中的中文分词策略研究

摘要第4-6页
Abstract第6-7页
第1章 引言第14-36页
    1.1 研究背景第14-16页
    1.2 研究现状第16-31页
        1.2.1 机器翻译的沿革第16-17页
        1.2.2 统计机器翻译第17-25页
        1.2.3 中文分词第25-29页
        1.2.4 已有的工作第29-31页
    1.3 论文的主要工作第31-34页
    1.4 论文的组织第34-36页
第2章 中文分词的串行式融合第36-54页
    2.1 基本思想第36-38页
    2.2 转换算法第38-41页
    2.3 对齐时分词第41-47页
        2.3.1 模型分析第41-42页
        2.3.2 搜索过程分析第42-44页
        2.3.3 训练过程分析第44-45页
        2.3.4 错误分析:理解对齐时分词第45-47页
    2.4 解码时分词第47-48页
    2.5 实验第48-52页
        2.5.1 数据准备第48-49页
        2.5.2 字对齐实验第49-50页
        2.5.3 字和基于普通分词的串行式融合第50-51页
        2.5.4 字和基于“面向机器翻译的分词”的串行式融合第51-52页
    2.6 本章小结第52-53页
    本章工作的相关科研成果第53-54页
第3章 基于多种分词的词对齐融合第54-74页
    3.1 基本思想第54-56页
    3.2 分词网络第56-60页
    3.3 融合算法第60-67页
        3.3.1 搜索空间第60-62页
        3.3.2 骨架连接置信度第62-63页
        3.3.3 搜索算法第63-64页
        3.3.4 训练算法第64-67页
    3.4 实验第67-71页
        3.4.1 数据准备第67-68页
        3.4.2 词对齐融合实验第68-70页
        3.4.3 结果分析第70-71页
    3.5 本章小结第71-72页
    本章工作的相关科研成果第72-74页
第4章 基于多种分词的判别式词对齐模型第74-90页
    4.1 基本思想第74-76页
    4.2 基于骨架连接的集束搜索算法第76-78页
    4.3 基于多种分词的最小错误率训练第78-79页
    4.4 基于多种分词的特征第79-84页
        4.4.1 基于多种词粒度的翻译概率第79-80页
        4.4.2 基于语言学知识的特征第80-82页
        4.4.3 词语相对位置特征第82页
        4.4.4 邻接词距离第82-83页
        4.4.5 候选词对齐特征第83页
        4.4.6 “m-n”型连接特征第83-84页
        4.4.7 骨架连接数目特征第84页
    4.5 实验第84-89页
        4.5.1 数据准备第84-85页
        4.5.2 和基于单一分词的词对齐模型的对比第85-87页
        4.5.3 和基于多种分词的词对齐融合方法的对比第87页
        4.5.4 候选分词数目对结果的影响第87-88页
        4.5.5 融入切字结果第88-89页
    4.6 本章小结第89页
    本章工作的相关科研成果第89-90页
第5章 基于多种分词的语言模型的融合第90-106页
    5.1 基本思想第90-92页
    5.2 语言模型分词与语言模型训练语料第92-95页
        5.2.1 基于词的语言模型第92-94页
        5.2.2 基于字的语言模型第94-95页
    5.3 语言模型分词与语言模型性能第95-99页
        5.3.1 模型的判别能力第95-96页
        5.3.2 模型的稀疏性第96-98页
        5.3.3 译文调序能力第98-99页
    5.4 融合基于字和基于词的语言模型第99页
    5.5 实验第99-103页
        5.5.1 数据准备第99-100页
        5.5.2 交叉熵评价实验第100-101页
        5.5.3 英汉机器翻译实验第101-102页
        5.5.4 日汉机器翻译实验第102-103页
    5.6 本章小结第103-104页
    本章工作的相关科研成果第104-106页
第6章 融合单语和双语知识的中文分词第106-122页
    6.1 基本思想第106-107页
    6.2 基于单语的分词第107-109页
    6.3 基于双语的分词第109-112页
    6.4 融合单语和双语知识的中文分词模型第112-116页
        6.4.1 融合算法第112-114页
        6.4.2 分词模型训练第114-116页
    6.5 实验第116-120页
        6.5.1 数据准备第116页
        6.5.2 实验设置第116-117页
        6.5.3 特征模版第117-118页
        6.5.4 基于人民日报训练语料的单语分词和基于双语的分词的融合第118-119页
        6.5.5 其他单语分词和基于双语的分词的融合第119页
        6.5.6 结果分析第119-120页
    6.6 本章小结第120-121页
    本章工作的相关科研成果第121-122页
第7章 总结与展望第122-125页
    7.1 本文的主要贡献第122-123页
    7.2 未来的研究方向第123-125页
参考文献第125-136页
致谢第136-137页
攻读博士学位期间科研工作情况第137-140页

论文共140页,点击 下载论文
上一篇:幼儿的朝鲜语单元音发音研究
下一篇:小学语文阅读教学的调查与研究--以北京市育才学校通州分校为例