首页--语言、文字论文--中国少数民族语言论文--蒙古语论文

蒙古语词法标注语料库的构建及相关技术研究

摘要第1-8页
ABSTRACT第8-12页
第一章 引言第12-25页
   ·选题背景及意义第12-13页
   ·词法标注方法介绍第13-15页
     ·基于规则的词法标注方法第13-14页
     ·基于统计的词法标注方法第14-15页
     ·规则和统计相结合的方法第15页
   ·蒙古语词法标注研究现状第15-21页
   ·研究方法及语料库介绍第21-23页
     ·研究方法第21页
     ·20万词级词法标注语料库第21-23页
   ·论文的主要工作第23-24页
   ·论文结构第24-25页
第二章 MGLEX系统介绍第25-32页
   ·蒙古语构形特征第25-26页
   ·模型结构第26-29页
   ·实验第29-32页
第三章 语料库校对第32-50页
   ·标记集问题第32-33页
   ·理论问题第33-49页
     ·复数后缀问题第33-34页
     ·数词的标注问题第34-35页
     ·名词的标注问题第35-39页
     ·"UGEI"的标注第39-45页
     ·第二类助动词的标注第45-48页
     ·其他第48-49页
   ·技术问题第49-50页
第四章 MGLEX系统的改进第50-71页
   ·语料库分析第50-51页
   ·具体措施第51-69页
     ·规则导致的错误及解决方案第51-54页
     ·未登录词干的识别问题第54-57页
     ·人名地名标注错误及解决方案第57-59页
     ·兼类词处理第59-69页
   ·实验第69-71页
结论第71-73页
参考文献第73-76页
附录1:20万语料库TXT格式第76-77页
附录2:20万语料库中出现的兼类词第77-87页
附录3:MGLEX系统标注结果示例:(NARAN-V D00R_A)第87-91页
致谢第91页
攻读硕士学位期间发表过的学术论文第91页

论文共91页,点击 下载论文
上一篇:蒙古语标准音清擦音实验研究
下一篇:从关联理论角度看电视连续剧《成吉思汗》的字幕翻译