基于枢轴语言的汉越短语机器翻译方法研究

摘要	第5-6页
ABSTRACT	第6-7页
第一章绪论	第11-17页
1.1 研究背景及意义	第11-12页
1.2 国内外研究现状	第12-14页
1.3 面临的关键问题	第14页
1.4 论文研究内容	第14-15页
1.5 论文组织结构	第15-17页
第二章统计机器翻译模型介绍	第17-25页
2.1 引言	第17页
2.2 翻译框架模型	第17-19页
2.2.1 信道-信源模型	第18页
2.2.2 对数-线性模型	第18-19页
2.3 翻译模型简介	第19-23页
2.3.1 基于词的翻译模型	第19页
2.3.2 基于短语的翻译模型	第19-20页
2.3.3 基于句法的翻译模型	第20-23页
2.4 机器翻译评价指标	第23-24页
2.5 本章小结	第24-25页
第三章基于维基百科的枢轴短语概率表构建	第25-37页
3.1 引言	第25页
3.2 维基百科分析	第25-28页
3.2.1 网页结构	第25-26页
3.2.2 锚文本	第26-27页
3.2.3 双语可比语料获取	第27-28页
3.3 汉英、英越双语可比网页获取	第28-30页
3.3.1 网页可比语料获取	第28页
3.3.2 网页解析与去噪	第28-29页
3.3.3 基于URL命名相似性的双语候选网页获取	第29-30页
3.4 中英、英越平行句对的抽取	第30-34页
3.4.1 基本模型	第30页
3.4.2 特征抽取	第30-34页
3.5 枢轴短语概率表构建	第34-35页
3.5.1 短语翻译概率	第34页
3.5.2 词汇化加权	第34-35页
3.6 本章小结	第35-37页
第四章融入枢轴短语概率表的汉越短语翻译	第37-51页
4.1 引言	第37-38页
4.2 标准短语概率表的构建	第38-42页
4.2.1 汉越短语对抽取	第38-40页
4.2.2 标准短语概率表构建	第40-42页
4.3 融合枢轴短语概率表的汉越短语翻译模型	第42-47页
4.3.1 基于短语的统计机器翻译模型	第42-43页
4.3.2 枢轴短语概率表融合	第43-46页
4.3.3 解码	第46-47页
4.4 实验及分析	第47-49页
4.4.1 验数据说明	第47-48页
4.4.2 实验及结果分析	第48-49页
4.5 本章小结	第49-51页
第五章基于枢轴语言的汉越短语机器翻译原型系统	第51-55页
5.1 系统背景	第51页
5.2 原型系统实现	第51-52页
5.2.1 基础开源工具	第51页
5.2.2 语料	第51-52页
5.3 系统设计及实现	第52-54页
5.3.1 系统设计框图	第52页
5.3.2 系统的构建过程	第52-54页
5.3.3 系统的实现	第54页
5.4 本章小结	第54-55页
第六章总结和展望	第55-57页
6.1 工作总结	第55-56页
6.2 工作展望	第56-57页
致谢	第57-59页
参考文献	第59-63页
附录A 作者在攻读硕士期间发表的论文	第63-65页
附录B 攻读硕士期间参与项目	第65页