基于统计的汉语词性标注方法的研究

0 前言	第1-18页
·自然语言理解概述	第7-8页
·机器翻译及其处理过程	第8-9页
·词性标注的意义	第9-10页
·标注词性的可能性和困难性	第10-11页
·词性标注应注意的问题	第11-12页
·兼类词及其特点	第12-14页
·词性标注的研究现状	第14-15页
·本文内容的提出及所做的工作	第15-18页
1 词性标注统计模型	第18-25页
·N-元标准统计模型	第18-19页
·基于统计的标注方法的基本问题	第19-20页
·参数获取方法	第20-21页
·数据稀疏现象	第21页
·平滑算法	第21-23页
·标准VITERBI算法	第23-25页
·标准VITERBI算法变量参数	第23-24页
·标准VITERBI算法复杂度	第24-25页
2 完全二隐马尔可夫阶统计模型	第25-33页
·隐马尔可夫模型	第25-26页
·隐马尔可夫模型的形式描述	第25页
·HMM的三个基本问题	第25-26页
·完全二阶模型参数	第26页
·二阶模型的平滑算法	第26-29页
·词性概率的平滑	第27-28页
·词汇概率的平滑	第28-29页
·未登录词的词性标注	第29-30页
·改进的VITERBI算法	第30-33页
·改进的VITERBI算法变量参数	第30-31页
·完全二阶HMM模型VITERBI算法描述	第31页
·改进的VITERBI算法的复杂度	第31-33页
3 词性标准系统的实现	第33-36页
·试验数据准备	第33页
·词性标注集	第33页
·训练语料准备	第33页
·系统的设计	第33-34页
·系统的开发环境	第33-34页
·系统功能要求	第34页
·系统接口定义及其数据结构	第34页
·系统实现描述	第34-36页
4 测试结果及分析	第36-40页
·测试结果	第36-37页
·错误分析	第37-40页
5 结论与展望	第40-42页
·结论	第40页
·展望	第40-42页
致谢	第42-43页
参考文献	第43-45页
附录	第45-50页
附录一: 汉语基本词类标记集	第45-46页
附录二: 定义	第46-47页
附录三: 系统所用到的词典	第47-50页