基于最大熵的汉语词性标注

摘要	第1-5页
Abstract	第5-8页
1 绪论	第8-15页
·课题的提出	第8-9页
·相关研究综述	第9-11页
·英语词性标注研究综述	第9-10页
·汉语词性标注研究综述	第10-11页
·词性标注的难点	第11-13页
·汉语兼类词的词性消歧	第11-12页
·数据稀疏问题的解决	第12页
·未登录词的词性处理方法	第12-13页
·主要的研究内容	第13-15页
2 理论背景	第15-22页
·自然语言处理	第15-16页
·词性标注	第16-17页
·统计模型概述	第17-20页
·规则方法的概率化	第20页
·数据平滑方法	第20-22页
3 基于最大熵的汉语词性标注	第22-47页
·词的分类与词的兼类问题	第22-23页
·词的分类	第22页
·词性标注集	第22-23页
·最大熵模型	第23-29页
·信息熵理论基础	第23-25页
·词性标注中的一个简单例子	第25-26页
·最大熵原理	第26-29页
·特征	第29-36页
·特征的组成	第29-30页
·影响词性标注的上下文特征	第30页
·最大熵特征模板	第30-31页
·最大熵特征生成	第31-34页
·特征选择	第34-36页
·参数估计方法	第36-37页
·GIS参数估计	第36-37页
·IIS参数估计	第37页
·词性标注	第37-41页
·生成标注模型	第38-39页
·词性标注算法	第39-41页
·未登录词词性标注	第41-47页
·未登录词的词性猜测	第42页
·未登录词的词性标注策略	第42-47页
4 实验结果和分析	第47-52页
·评测方法	第47-48页
·所使用的语料	第48页
·实验结果及分析	第48-52页
5 错误分析	第52-55页
结论	第55-57页
参考文献	第57-60页
附录A 北大2001词性标注集	第60-62页
攻读硕士学位期间发表学术论文情况	第62-63页
致谢	第63-64页