导言 | 第1-9页 |
0.1 蒙古文同形异音词读音识别研究的意义 | 第6页 |
0.2 蒙古文同形异音词读音识别的研究方法 | 第6-8页 |
0.3 蒙古文同形异音词读音识别的研究基础 | 第8-9页 |
第1章 问题的来源及其处理方法 | 第9-14页 |
1.1 同形异音词的来源 | 第9-10页 |
1.2 未处理同形异音词在语料库中的分布情况以及处理方法 | 第10-12页 |
1.2.1 在100TUM里仅出现一种读音的同形异音词 | 第10-11页 |
1.2.2 在100TUM里出现两种以上读音的同形异音词 | 第11-12页 |
1.2.3 前面标有“+”号的非同形异音词 | 第12页 |
1.3 识别同形异音词的技术难点 | 第12-14页 |
1.3.1 观察窗口的大小问题 | 第12-13页 |
1.3.2 词类问题 | 第13-14页 |
第2章 蒙古文同形异音词的读音识别条件 | 第14-66页 |
2.1 语料和标记说明 | 第14页 |
2.1.1 M_G语料的基本情况 | 第14页 |
2.1.2 识别条件中用到的标记符号 | 第14页 |
2.2 识别条件的归纳方案 | 第14-15页 |
2.2.1 根据关键词本身的信息 | 第14-15页 |
2.2.2 根据与关键词同现的搭配词信息 | 第15页 |
2.2.3 根据关键词前后出现的标点符号信息 | 第15页 |
2.3 蒙古文同形异音词的读音识别条件 | 第15-66页 |
2.3.1 在100TUM里仅出现一种读音的同形异音词读音识别条件 | 第15-38页 |
2.3.2 在100TUM里出现两种以上读音的同形异音词读音识别条件 | 第38-60页 |
2.3.3 前面标有“+”号的非同形异音词读音识别条件 | 第60-66页 |
第3章 结语 | 第66-68页 |
3.1 人名、地名中的同形异音词 | 第66-67页 |
3.2 统计语料的局限性 | 第67页 |
3.3 语义信息的支持 | 第67-68页 |
参考文献 | 第68-69页 |
附录1:由MTOA转写产生的文本与原文的比较样例 | 第69-71页 |
附录2:同形异音词的读音自动识别结果样例 | 第71-72页 |
后记 | 第72页 |