致谢 | 第5-6页 |
摘要 | 第6-7页 |
ABSTRACT | 第7-8页 |
1 引言 | 第12-18页 |
1.1 研究背景及意义 | 第12-13页 |
1.2 研究发展和现状 | 第13-16页 |
1.2.1 数字时间表达式识别的研究现状 | 第13-14页 |
1.2.2 双语数字时间表达式的翻译研究现状 | 第14-15页 |
1.2.3 机器翻译的研究现状 | 第15-16页 |
1.3 论文研究内容 | 第16-18页 |
2 理论与技术基础 | 第18-30页 |
2.1 数字时间表达式的识别方法 | 第18-22页 |
2.1.1 基于统计的序列标注方法 | 第18-21页 |
2.1.2 基于规则的识别方法 | 第21-22页 |
2.2 词对齐与短语对齐 | 第22-27页 |
2.2.1 基于噪声信道模型的词对齐方法 | 第23-26页 |
2.2.2 基于相似度计算的词对齐方法 | 第26-27页 |
2.3 数字时间表达式的翻译方法 | 第27-29页 |
2.4 本章小结 | 第29-30页 |
3 日汉数字时间表达式的识别研究 | 第30-41页 |
3.1 数字时间表达式定义与分类 | 第30-31页 |
3.1.1 时间表达式 | 第30-31页 |
3.1.2 数字表达式 | 第31页 |
3.2 基于规则和统计相结合的数字时间识别系统框架 | 第31-33页 |
3.3 基于规则的数字时间表达式的识别 | 第33-37页 |
3.3.1 基于规则的识别框架 | 第33页 |
3.3.2 日语数字时间表达式的识别规则 | 第33-35页 |
3.3.3 汉语数字时间表达式的识别规则 | 第35-37页 |
3.4 基于统计的数字时间表达式的识别 | 第37-39页 |
3.4.1 基于CRF的识别框架 | 第37-38页 |
3.4.2 特征与特征模版 | 第38-39页 |
3.5 规则方法与统计方法的融合 | 第39-40页 |
3.5.1 错误驱动思想 | 第39-40页 |
3.5.2 贪心融合策略 | 第40页 |
3.6 本章小结 | 第40-41页 |
4 日汉数字时间表达式的对齐研究 | 第41-48页 |
4.1 对齐任务问题描述 | 第41-43页 |
4.2 基于位置约束和相似度度量的数字时间双向对齐 | 第43-47页 |
4.2.1 基于位置约束的数字时间双向对齐 | 第43-46页 |
4.2.2 基于相似度度量的数字时间双向对齐 | 第46-47页 |
4.3 本章小结 | 第47-48页 |
5 数字时间表达式识别及翻译在机器翻译中的应用 | 第48-57页 |
5.1 层次短语机器翻译模型 | 第48-50页 |
5.1.1 模型形式化描述 | 第48-49页 |
5.1.2 模型的训练与解码 | 第49-50页 |
5.1.3 机器翻译系统流程 | 第50页 |
5.2 融入数字时间表达式识别及翻译模型的翻译系统 | 第50-53页 |
5.3 基于规则的数字时间表达式独立翻译 | 第53-55页 |
5.4 译文评测方法 | 第55-56页 |
5.4.1 自动评测方法 | 第55页 |
5.4.2 人工评测方法 | 第55-56页 |
5.5 本章小结 | 第56-57页 |
6 本文涉及的实验与结果分析 | 第57-66页 |
6.1 日汉数字时间表达式的识别实验 | 第57-60页 |
6.1.1 实验数据 | 第57-58页 |
6.1.2 评测方法 | 第58页 |
6.1.3 实验结果及分析 | 第58-60页 |
6.2 日汉数字时间表达式的对齐实验 | 第60-61页 |
6.2.1 实验数据 | 第60页 |
6.2.2 评测方法 | 第60-61页 |
6.2.3 实验结果及分析 | 第61页 |
6.3 融入数字时间表达式识别及翻译的翻译系统 | 第61-65页 |
6.3.1 实验数据 | 第61-62页 |
6.3.2 评测方法 | 第62页 |
6.3.3 实验结果及分析 | 第62-65页 |
6.4 本章小结 | 第65-66页 |
7 总结与展望 | 第66-68页 |
7.1 总结 | 第66页 |
7.2 展望 | 第66-68页 |
参考文献 | 第68-72页 |
作者简历及攻读硕士学位期间取得的研究成果 | 第72-74页 |
学位论文数据集 | 第74页 |