基于最大熵的汉语词性标注
摘要 | 第1-5页 |
Abstract | 第5-8页 |
1 绪论 | 第8-15页 |
·课题的提出 | 第8-9页 |
·相关研究综述 | 第9-11页 |
·英语词性标注研究综述 | 第9-10页 |
·汉语词性标注研究综述 | 第10-11页 |
·词性标注的难点 | 第11-13页 |
·汉语兼类词的词性消歧 | 第11-12页 |
·数据稀疏问题的解决 | 第12页 |
·未登录词的词性处理方法 | 第12-13页 |
·主要的研究内容 | 第13-15页 |
2 理论背景 | 第15-22页 |
·自然语言处理 | 第15-16页 |
·词性标注 | 第16-17页 |
·统计模型概述 | 第17-20页 |
·规则方法的概率化 | 第20页 |
·数据平滑方法 | 第20-22页 |
3 基于最大熵的汉语词性标注 | 第22-47页 |
·词的分类与词的兼类问题 | 第22-23页 |
·词的分类 | 第22页 |
·词性标注集 | 第22-23页 |
·最大熵模型 | 第23-29页 |
·信息熵理论基础 | 第23-25页 |
·词性标注中的一个简单例子 | 第25-26页 |
·最大熵原理 | 第26-29页 |
·特征 | 第29-36页 |
·特征的组成 | 第29-30页 |
·影响词性标注的上下文特征 | 第30页 |
·最大熵特征模板 | 第30-31页 |
·最大熵特征生成 | 第31-34页 |
·特征选择 | 第34-36页 |
·参数估计方法 | 第36-37页 |
·GIS参数估计 | 第36-37页 |
·IIS参数估计 | 第37页 |
·词性标注 | 第37-41页 |
·生成标注模型 | 第38-39页 |
·词性标注算法 | 第39-41页 |
·未登录词词性标注 | 第41-47页 |
·未登录词的词性猜测 | 第42页 |
·未登录词的词性标注策略 | 第42-47页 |
4 实验结果和分析 | 第47-52页 |
·评测方法 | 第47-48页 |
·所使用的语料 | 第48页 |
·实验结果及分析 | 第48-52页 |
5 错误分析 | 第52-55页 |
结论 | 第55-57页 |
参考文献 | 第57-60页 |
附录A 北大2001词性标注集 | 第60-62页 |
攻读硕士学位期间发表学术论文情况 | 第62-63页 |
致谢 | 第63-64页 |