摘要 | 第1-4页 |
ABSTRACT | 第4-5页 |
目录 | 第5-8页 |
图标目录 | 第8-9页 |
第一章 引言 | 第9-14页 |
·基于统计的机器翻译系统简介 | 第9-10页 |
·研究统计机器翻译系统的目的 | 第9-10页 |
·统计机器翻译系统的含义 | 第10页 |
·基于统计的机器翻译系统 | 第10页 |
·国内外机器翻译的研究 | 第10-12页 |
·国内研究现状及动态 | 第10-11页 |
·国外研究现状及动态 | 第11-12页 |
·本文的研究内容 | 第12-14页 |
第二章 相关理论与技术 | 第14-27页 |
·机器翻译方法研究 | 第14-19页 |
·基于规则的机器翻译方法(Rule-Based MT) | 第14页 |
·基于统计的机器翻译方法(Statistical MT) | 第14-16页 |
·基于实例的机器翻译方法(Example-Based MT) | 第16页 |
·基于模板(模式)的机器翻译方法(Pattern-Based MT) | 第16-17页 |
·基于有限状态自动机的机器翻译方法(Vector-Based MT) | 第17-18页 |
·多引擎的机器翻译方法(Multi-Engine MT) | 第18-19页 |
·基于统计的机器翻译方法 | 第19-24页 |
·基于信源信道思想的统计机器翻译方法 | 第19-22页 |
·IBM的统计机器翻译方法 | 第19页 |
·王野翊在卡内基—梅隆大学(CMU)的工作 | 第19-20页 |
·约翰霍普金斯大学(JHU)的统计机器翻译夏季研讨班 | 第20页 |
·Yamada和Knight的工作 | 第20-21页 |
·Och等人的工作 | 第21-22页 |
·基于最大熵思想的统计机器翻译方法 | 第22-24页 |
·统计机器翻译的评测方法 | 第24-27页 |
·几个简单的机器翻译自动评价指标 | 第24页 |
·基于测试点的机器翻译自动评测方法 | 第24-25页 |
·IBM的BLEU评价方法 | 第25-27页 |
第三章 基于统计的机器翻译系统模型 | 第27-30页 |
·主要功能模块 | 第27-28页 |
·源语言句子预处理模块 | 第27页 |
·翻译模型搜索模块 | 第27页 |
·语言模型计算模块 | 第27-28页 |
·求翻译结果模块 | 第28页 |
·调整参数模块 | 第28页 |
·系统工作流程 | 第28-30页 |
第四章 基于统计的蒙汉机器翻译系统的实现 | 第30-53页 |
·构建蒙汉双语对齐语料库 | 第30页 |
·系统中各文件的格式定义 | 第30-33页 |
·规范的双语语料库格式定义 | 第30-31页 |
·分词的训练语料库格式定义 | 第31-32页 |
·翻译概率表格式定义 | 第32-33页 |
·语料库预处理 | 第33-38页 |
·蒙汉双语语料库预处理 | 第33-34页 |
·蒙古语语料库预处理 | 第34-38页 |
·蒙古语名词与汉语名词 | 第34-35页 |
·蒙古语动词与汉语动词 | 第35-38页 |
·汉语语言模型的建立 | 第38-42页 |
·统计语言模型 | 第38-39页 |
·语言模型中的平滑技术 | 第39-40页 |
·SRI语言模型建立工具 | 第40-41页 |
·语言模型格式定义 | 第41-42页 |
·蒙汉翻译模型的建立 | 第42-46页 |
·IBM统计翻译模型 | 第42-44页 |
·GIZA翻译模型建立工具 | 第44-45页 |
·词语对齐模块实现 | 第45-46页 |
·构建解码器 | 第46-50页 |
·基本思想 | 第46-47页 |
·堆栈搜索算法(Stack Search) | 第47-49页 |
·g_H的算法 | 第48-49页 |
·h_H的算法 | 第49页 |
·割舍搜索/放弃 | 第49页 |
·特征参数训练 | 第49-50页 |
·YASMET重排序法 | 第50页 |
·扩充词典 | 第50-53页 |
第五章 实验 | 第53-59页 |
·实验环境 | 第53-55页 |
·开发环境 | 第53页 |
·分词工具 | 第53-55页 |
·实验数据说明 | 第55页 |
·评估方法 | 第55-57页 |
·实验结果 | 第57-59页 |
第六章 结论与未来研究方向 | 第59-61页 |
研究生期间发表论文 | 第61-62页 |
致谢 | 第62-63页 |
参考文献 | 第63-64页 |