短语统计机器翻译关键技术研究

摘要	第5-7页
Abstract	第7-8页
第1章引言	第12-20页
1.1 研究背景	第12-16页
1.2 研究内容	第16-17页
1.3 论文结构	第17-20页
第2章短语统计机器翻译	第20-36页
2.1 背景知识	第20-22页
2.1.1 短语统计机器翻译整体架构	第20-21页
2.1.2 数学模型	第21-22页
2.2 基于短语的统计模型	第22-35页
2.2.1 数据预处理	第22-24页
2.2.2 词对齐	第24-25页
2.2.3 短语翻译表训练	第25-28页
2.2.4 调序模型训练	第28-30页
2.2.5 语言模型训练	第30-31页
2.2.6 解码器	第31页
2.2.7 参数优化	第31-33页
2.2.8 性能评价	第33-35页
2.3 小结	第35-36页
第3章翻译模型优化	第36-54页
3.1 一致性短语	第36页
3.2 传统启发式短语对抽取方法	第36-40页
3.2.1 算法	第36-39页
3.2.2 传统短语对	第39-40页
3.3 基于组合的短语对抽取方法	第40-44页
3.3.1 最小短语对	第41-42页
3.3.2 组合短语对	第42-43页
3.3.3 组合的短语对抽取算法	第43-44页
3.4 实验	第44-51页
3.4.1 实验设置	第45页
3.4.2 实验及结果分析	第45-48页
3.4.3 使用过滤方法	第48页
3.4.4 边缘对空词汇扩展	第48-49页
3.4.5 束大小	第49-50页
3.4.6 层次短语系统使用组合方法	第50-51页
3.5 相关工作比较	第51-52页
3.6 小结	第52-54页
第4章解码优化	第54-74页
4.1 解码	第54-55页
4.2 解码算法	第55-60页
4.2.1 ITG文法	第55-56页
4.2.2 CYK解码算法	第56-58页
4.2.3 解码过程	第58-59页
4.2.4 特征设计	第59-60页
4.3 剪枝技术	第60-65页
4.3.1 立方剪枝	第61-63页
4.3.2 立方剪枝优化	第63-65页
4.4 实词被删问题	第65-68页
4.4.1 频次特征	第66页
4.4.2 源语言实词词典特征	第66-67页
4.4.3 目标语言实词词典特征	第67页
4.4.4 双语实词词典特征	第67-68页
4.5 翻译后处理	第68-71页
4.5.1 英文词汇的大写还原	第69-70页
4.5.2 标点位置还原	第70-71页
4.6 小结	第71-74页
第5章总结与展望	第74-76页
5.1 工作总结	第74-75页
5.2 未来工作	第75-76页
参考文献	第76-80页
致谢	第80-82页
攻读硕士期间发表的论著及参与的项目	第82页