首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Morfessor的维吾尔语词干提取和词性标注的研究

摘要第1-3页
Abstract第3-6页
第一章 绪论第6-12页
   ·研究背景与意义第6-7页
     ·课题来源第6页
     ·研究背景第6-7页
     ·研究意义第7页
   ·国内外研究进展第7-10页
     ·词干提取的研究状况第7-8页
     ·词性标注的研究状况第8-10页
   ·本文所做的工作第10页
   ·论文结构第10-12页
第二章 基于CRF的维吾尔语词性标注研究第12-32页
   ·维吾尔语的词类第12-13页
   ·主要的词性标注方法以及原理第13-16页
     ·基于规则的词性标注方法第13页
     ·基于统计的词性标注方法第13-16页
       ·N-Gram的语言模型第14页
       ·隐马尔可夫模型第14-15页
       ·最大熵马尔可夫模型第15-16页
     ·基于统计和规则结合的词性标注方法第16页
     ·基于转换的错误驱动词性标注方法第16页
   ·CRF的介绍第16-22页
     ·CRF模型的原理第17-18页
     ·CRF模型的概率参数估计第18-19页
     ·CRF数据集格式第19-20页
     ·CRF模板文件的结构和构建第20-22页
   ·数据预处理过程及人工标注平台的实现第22-25页
     ·制定词性标记集第22页
     ·人工标注平台的实现第22-25页
   ·维吾尔语自动词性标注系统的实现第25-31页
     ·维吾尔语词性标注难点第26-28页
     ·标注系统的设计第28-31页
   ·本章小结第31-32页
第三章 基于Morfessor的维吾尔语词干提取研究第32-54页
   ·主要的词干提取方法以及原理第33-37页
     ·基于规则的词干提取方法第33-34页
     ·基于词典查找的词干提取方法第34-35页
     ·基于统计的词干提取方法第35-36页
     ·基于混合的词干提取方法第36-37页
   ·Morfessor的介绍第37-42页
     ·Morfessor的原理第38-39页
     ·Morfessor统计模型的(数学)表示第39-41页
     ·Morfessor搜索算法第41页
     ·Morfessor数据集格式第41-42页
   ·数据预处理过程与工具设计实现第42-44页
   ·维吾尔语词干提取系统的实现第44-52页
     ·维吾尔语的特点第44-45页
     ·维吾尔语词干提取的难点第45-48页
     ·词干提取系统的设计第48-52页
   ·本章小结第52-54页
第四章 试验与结果分析第54-73页
   ·实验数据来源第54-55页
   ·实验环境第55-56页
     ·硬件环境第55-56页
     ·开发环境第56页
   ·实验 1(维吾尔语自动词性标注)第56-62页
     ·CRF训练第57-59页
     ·CRF测试第59-62页
   ·实验 2(维吾尔语自动词干提取)第62-70页
     ·Morfessor模型训练第64-66页
     ·Morfessor模型测试第66-70页
   ·本文研究对维汉双向统计机器翻译结果的影响第70-71页
   ·本章小结第71-73页
第五章 总结与展望第73-75页
   ·总结第73-74页
   ·下一步工作展望第74-75页
参考文献第75-79页
附录第79-84页
 附录 1:新疆多语种信息技术重点实验室维吾尔语词性标记集第79-82页
 附录 2:拉丁维文字母对照表第82页
 附录 3:维吾尔文字母表第82-84页
攻读硕士学位期间的科研成果第84-86页
致谢第86-87页

论文共87页,点击 下载论文
上一篇:基于轮廓的维吾尔文单词识别研究
下一篇:基于移动数据用户行为挖掘及相似性计算方法