| 摘要 | 第1-8页 |
| ABSTRACT | 第8-12页 |
| 第一章 引言 | 第12-25页 |
| ·选题背景及意义 | 第12-13页 |
| ·词法标注方法介绍 | 第13-15页 |
| ·基于规则的词法标注方法 | 第13-14页 |
| ·基于统计的词法标注方法 | 第14-15页 |
| ·规则和统计相结合的方法 | 第15页 |
| ·蒙古语词法标注研究现状 | 第15-21页 |
| ·研究方法及语料库介绍 | 第21-23页 |
| ·研究方法 | 第21页 |
| ·20万词级词法标注语料库 | 第21-23页 |
| ·论文的主要工作 | 第23-24页 |
| ·论文结构 | 第24-25页 |
| 第二章 MGLEX系统介绍 | 第25-32页 |
| ·蒙古语构形特征 | 第25-26页 |
| ·模型结构 | 第26-29页 |
| ·实验 | 第29-32页 |
| 第三章 语料库校对 | 第32-50页 |
| ·标记集问题 | 第32-33页 |
| ·理论问题 | 第33-49页 |
| ·复数后缀问题 | 第33-34页 |
| ·数词的标注问题 | 第34-35页 |
| ·名词的标注问题 | 第35-39页 |
| ·"UGEI"的标注 | 第39-45页 |
| ·第二类助动词的标注 | 第45-48页 |
| ·其他 | 第48-49页 |
| ·技术问题 | 第49-50页 |
| 第四章 MGLEX系统的改进 | 第50-71页 |
| ·语料库分析 | 第50-51页 |
| ·具体措施 | 第51-69页 |
| ·规则导致的错误及解决方案 | 第51-54页 |
| ·未登录词干的识别问题 | 第54-57页 |
| ·人名地名标注错误及解决方案 | 第57-59页 |
| ·兼类词处理 | 第59-69页 |
| ·实验 | 第69-71页 |
| 结论 | 第71-73页 |
| 参考文献 | 第73-76页 |
| 附录1:20万语料库TXT格式 | 第76-77页 |
| 附录2:20万语料库中出现的兼类词 | 第77-87页 |
| 附录3:MGLEX系统标注结果示例:(NARAN-V D00R_A) | 第87-91页 |
| 致谢 | 第91页 |
| 攻读硕士学位期间发表过的学术论文 | 第91页 |