摘要 | 第2-4页 |
Abstract | 第4-6页 |
1. 绪论 | 第10-31页 |
1.1 研究背景及意义 | 第10-13页 |
1.1.1 为什么用机器翻译 | 第10-12页 |
1.1.2 机器翻译的简要发展史 | 第12-13页 |
1.2 机器翻译方法 | 第13-16页 |
1.3 EBMT方法及相关研究 | 第16-22页 |
1.4 黏着性语言机器翻译研究现状 | 第22-23页 |
1.5 维吾尔语信息处理研究现状 | 第23-26页 |
1.6 本文研究内容及相关研究 | 第26-31页 |
2. 维吾尔语词法分析的有向图模型 | 第31-54页 |
2.1 引言 | 第31-32页 |
2.2 维吾尔语词法的特点与难点 | 第32-36页 |
2.3 维吾尔语音变现象的自动还原模型 | 第36-43页 |
2.3.1 词内对齐算法 | 第37-38页 |
2.3.2 特征模板的选择以及最大熵训练 | 第38-39页 |
2.3.3 自动还原过程的解码 | 第39-40页 |
2.3.4 实验及分析 | 第40-42页 |
2.3.5 对发生错误的分析 | 第42-43页 |
2.4 维吾尔语词法的有向图模型 | 第43-52页 |
2.4.1 词干、词尾切分的有向树模型 | 第44-45页 |
2.4.2 切分与标注联合的有向图模型 | 第45-47页 |
2.4.3 递归枚举词法分析候选 | 第47-49页 |
2.4.4 实验及分析 | 第49-52页 |
2.5 本章小结 | 第52-54页 |
3. 维汉词语对齐 | 第54-83页 |
3.1 引言 | 第54-55页 |
3.2 词语对齐方法分析 | 第55-56页 |
3.3 维汉词对齐存在的问题 | 第56-60页 |
3.4 维吾尔语词尾的泛化形式及对维汉词对齐的影响 | 第60-67页 |
3.4.1 维吾尔语词尾的泛化形式 | 第60-63页 |
3.4.2 相关实验及结论 | 第63-67页 |
3.5 不同词尾粒度对维汉词对齐的影响分析 | 第67-81页 |
3.5.1 维吾尔语语法范畴及特点 | 第68-69页 |
3.5.2 统计分析维吾尔语词尾在汉语中的译文情况 | 第69-71页 |
3.5.3 创建不同词尾粒度模板方案 | 第71-78页 |
3.5.4 实验及分析 | 第78-81页 |
3.6 本章小结 | 第81-83页 |
4. 维吾尔语多词表达抽取研究 | 第83-106页 |
4.1 引言 | 第83-84页 |
4.2 维吾尔语多词表达的分类及特点 | 第84-88页 |
4.3 多词表达抽取的统计方法 | 第88-90页 |
4.3.1 点互信息 | 第88-89页 |
4.3.2 卡方(X~2)检验 | 第89页 |
4.3.3 对数似然比(Log Likelihood Ratio,LLR) | 第89-90页 |
4.4 统计方法在维吾尔语多词表达抽取中的效果 | 第90-96页 |
4.4.1 预处理及形态的引入 | 第91-92页 |
4.4.2 实验及分析 | 第92-96页 |
4.5 基于模板的维吾尔语多词表达抽取 | 第96-104页 |
4.5.1 维吾尔语多词表达的模板 | 第97-102页 |
4.5.2 与规则结合的改进的互信息方法 | 第102-103页 |
4.5.3 实验及分析 | 第103-104页 |
4.6 本章小结 | 第104-106页 |
5. 基于实例的维汉机器翻译系统的构建 | 第106-118页 |
5.1 基于实例的机器翻译系统结构 | 第106-107页 |
5.2 基于实例的维汉机器翻译的相关问题 | 第107-114页 |
5.3 系统框架 | 第114-117页 |
5.4 本章小结 | 第117-118页 |
6. 结论 | 第118-121页 |
7. 参考文献 | 第121-133页 |
附录 | 第133-136页 |
附录1 维吾尔语阿拉伯字母与拉丁字母对应表 | 第133-134页 |
附录2 维吾尔语词尾泛化形式 | 第134-136页 |
攻读博士期间发表的论文 | 第136-138页 |
攻读博士期间主持及参加的项目 | 第138-139页 |
致谢 | 第139-140页 |