首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--翻译机论文

面向统计机器翻译的语料处理与评价技术研究

摘要第1-7页
Abstract第7-11页
第1章 绪论第11-17页
   ·研究背景第11-12页
   ·研究现状第12-13页
   ·本文的主要思路和贡献第13-14页
   ·章节安排第14-17页
第2章 统计机器翻译框架第17-23页
   ·统计机器翻译平台的翻译流程介绍第17-21页
   ·本章小结第21-23页
第3章 语料前(预)处理技术和实践第23-33页
   ·预处理各个模块第23页
   ·语料预处理流程介绍第23-27页
     ·乱码处理模块第23-24页
     ·半全角转换第24页
     ·英文词串化和大小写转换第24-25页
     ·中文分词第25-26页
     ·双语句对过滤第26页
     ·命名实体翻译替换第26-27页
   ·面向专利翻译的语料预处理第27-32页
     ·分词错误纠正第27-28页
     ·专利号的识别翻译翻译和泛化第28-29页
     ·公式串的识别翻译和泛化第29页
     ·数量词识别翻译第29-30页
     ·专业术语的处理第30页
     ·可直译成分的处理第30页
     ·不同预处理处理对机器翻译性能的影响第30-32页
   ·预处理小结第32-33页
第4章 术语翻译资源的构建和利用第33-37页
   ·基于网页的术语翻译资源获取第33-34页
   ·从专业文献获取术语翻译资源第34页
   ·NEUNLP双语翻译资源的整理和格式标准定义第34页
   ·本章小结第34-37页
第5章 统计机器翻译语料质量评价和训练集的构建第37-65页
   ·语料句对质量评价方法第37-45页
     ·基于双语词典的句对翻译质量第38页
     ·基于句对翻译概率的方法第38-39页
     ·基于流畅度和忠诚度的句对质量打分第39页
     ·实验和分析第39-45页
     ·小结第45页
   ·统计机器翻译训练语料的选取和高质量训练集的构建第45-55页
     ·基于句对质量和覆盖度的方法第45-55页
   ·CWMT2011中英任务训练语料的选取和训练集构建第55-59页
     ·训练语料选取和训练集构建的过程第56-57页
     ·实验与分析第57-58页
     ·选取双语句对构建训练集考虑的因素第58-59页
   ·给定测试集状况下训练集的优化策略初探第59-63页
     ·基于检索技术选取与测试集相关句对优化训练集的方法第59-61页
     ·基于语言模型技术选取与测试集相似句优化训练集的方法第61-62页
     ·两种基于相似度优化构建语料方法的比较第62-63页
   ·结论和相关总结第63-65页
第6章 工作总结与展望第65-67页
参考文献第67-71页
致谢第71-73页
攻读硕士期间发表的论文及参与的项目第73页

论文共73页,点击 下载论文
上一篇:供暖企业收费管理系统的设计与实现
下一篇:小文本聚类技术及其在电子邮件中的应用研究