基于统计模型的汉语词性标注系统的改进方法研究

摘要	第1-5页
ABSTRACT	第5-8页
第一章前言	第8-14页
·自然语言处理与汉语词法分析简介	第8-9页
·词性标注的主要任务和目的意义	第9-10页
·汉语词性标注的难点和重点	第10-11页
·词性标注的常用方法及研究现状	第11-12页
·统计模型的不足与改进	第12页
·课题目的意义与内容	第12-14页
第二章常用统计语法模型	第14-21页
·统计模型简介	第14-15页
·N元语法模型	第15-17页
·简单的N元语法	第15-16页
·N元语法对训练语料的敏感性	第16页
·平滑	第16-17页
·回退	第17页
·HMM模型	第17-21页
·HMM的一般形式	第17-18页
·HMM的三个问题	第18页
·Viterbi算法	第18-21页
第三章创新与改进	第21-28页
·逆向语法模型	第21-23页
·逆向语法模型的提出	第21-22页
·逆向语法模型的定义及扩展	第22-23页
·基于转换的纠错处理	第23-28页
·基于转换的纠错方法的提出	第23-24页
·规则挖掘的方法	第24-27页
·规则定义和纠错处理算法	第27-28页
第四章系统的设计实现与改进	第28-38页
·未登录词的处理	第28-29页
·词性标注集的选取与语料的准备	第29-31页
·基本统计模型的实现	第31-32页
·统计模型词性标注系统的设计与实现	第32-35页
·逆向语法模型的实现	第35-37页
·基于转换纠错模块的实现	第37-38页
第五章实验结果与分析	第38-53页
·词性标注集和语料对词性标注结果的影响	第38-42页
·词性标注集对标注准确率的影响	第38-39页
·训练集容量对标注准确率的影响	第39-41页
·语料库内容对标注准确率的影响	第41-42页
·各种统计模型词性标注结果的对比	第42-45页
·二元和三元语法模型的对比	第42-43页
·N元语法模型与HMM模型的对比	第43-45页
·正向与逆向语法模型结果对比	第45-47页
·使用基于转换纠错方法的效果	第47-52页
·统计词性标注模型的错误分布情况	第47-48页
·使用数据挖掘方法获取规则的效果	第48-50页
·纠错模块的实际效果	第50-52页
·实验结果总结	第52-53页
第六章总结与展望	第53-54页
参考文献	第54-56页
附录	第56-60页
致谢	第60-61页
作者攻读学位期间发表的学术论文目录	第61页