摘要 | 第1-8页 |
ABSTRACT | 第8-12页 |
第一章 引言 | 第12-25页 |
·选题背景及意义 | 第12-13页 |
·词法标注方法介绍 | 第13-15页 |
·基于规则的词法标注方法 | 第13-14页 |
·基于统计的词法标注方法 | 第14-15页 |
·规则和统计相结合的方法 | 第15页 |
·蒙古语词法标注研究现状 | 第15-21页 |
·研究方法及语料库介绍 | 第21-23页 |
·研究方法 | 第21页 |
·20万词级词法标注语料库 | 第21-23页 |
·论文的主要工作 | 第23-24页 |
·论文结构 | 第24-25页 |
第二章 MGLEX系统介绍 | 第25-32页 |
·蒙古语构形特征 | 第25-26页 |
·模型结构 | 第26-29页 |
·实验 | 第29-32页 |
第三章 语料库校对 | 第32-50页 |
·标记集问题 | 第32-33页 |
·理论问题 | 第33-49页 |
·复数后缀问题 | 第33-34页 |
·数词的标注问题 | 第34-35页 |
·名词的标注问题 | 第35-39页 |
·"UGEI"的标注 | 第39-45页 |
·第二类助动词的标注 | 第45-48页 |
·其他 | 第48-49页 |
·技术问题 | 第49-50页 |
第四章 MGLEX系统的改进 | 第50-71页 |
·语料库分析 | 第50-51页 |
·具体措施 | 第51-69页 |
·规则导致的错误及解决方案 | 第51-54页 |
·未登录词干的识别问题 | 第54-57页 |
·人名地名标注错误及解决方案 | 第57-59页 |
·兼类词处理 | 第59-69页 |
·实验 | 第69-71页 |
结论 | 第71-73页 |
参考文献 | 第73-76页 |
附录1:20万语料库TXT格式 | 第76-77页 |
附录2:20万语料库中出现的兼类词 | 第77-87页 |
附录3:MGLEX系统标注结果示例:(NARAN-V D00R_A) | 第87-91页 |
致谢 | 第91页 |
攻读硕士学位期间发表过的学术论文 | 第91页 |