首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于统计模型的汉语词性标注系统的改进方法研究

摘要第1-5页
ABSTRACT第5-8页
第一章 前言第8-14页
   ·自然语言处理与汉语词法分析简介第8-9页
   ·词性标注的主要任务和目的意义第9-10页
   ·汉语词性标注的难点和重点第10-11页
   ·词性标注的常用方法及研究现状第11-12页
   ·统计模型的不足与改进第12页
   ·课题目的意义与内容第12-14页
第二章 常用统计语法模型第14-21页
   ·统计模型简介第14-15页
   ·N元语法模型第15-17页
     ·简单的N元语法第15-16页
     ·N元语法对训练语料的敏感性第16页
     ·平滑第16-17页
     ·回退第17页
   ·HMM模型第17-21页
     ·HMM的一般形式第17-18页
     ·HMM的三个问题第18页
     ·Viterbi算法第18-21页
第三章 创新与改进第21-28页
   ·逆向语法模型第21-23页
     ·逆向语法模型的提出第21-22页
     ·逆向语法模型的定义及扩展第22-23页
   ·基于转换的纠错处理第23-28页
     ·基于转换的纠错方法的提出第23-24页
     ·规则挖掘的方法第24-27页
     ·规则定义和纠错处理算法第27-28页
第四章 系统的设计实现与改进第28-38页
   ·未登录词的处理第28-29页
   ·词性标注集的选取与语料的准备第29-31页
   ·基本统计模型的实现第31-32页
   ·统计模型词性标注系统的设计与实现第32-35页
   ·逆向语法模型的实现第35-37页
   ·基于转换纠错模块的实现第37-38页
第五章 实验结果与分析第38-53页
   ·词性标注集和语料对词性标注结果的影响第38-42页
     ·词性标注集对标注准确率的影响第38-39页
     ·训练集容量对标注准确率的影响第39-41页
     ·语料库内容对标注准确率的影响第41-42页
   ·各种统计模型词性标注结果的对比第42-45页
     ·二元和三元语法模型的对比第42-43页
     ·N元语法模型与HMM模型的对比第43-45页
   ·正向与逆向语法模型结果对比第45-47页
   ·使用基于转换纠错方法的效果第47-52页
     ·统计词性标注模型的错误分布情况第47-48页
     ·使用数据挖掘方法获取规则的效果第48-50页
     ·纠错模块的实际效果第50-52页
   ·实验结果总结第52-53页
第六章 总结与展望第53-54页
参考文献第54-56页
附录第56-60页
致谢第60-61页
作者攻读学位期间发表的学术论文目录第61页

论文共61页,点击 下载论文
上一篇:基于Ajax技术的RIA应用框架的研究与实现
下一篇:Web Service的研究及其在信息管理系统中的应用