基于最大熵的汉语介词短语自动识别

摘要	第1-5页
Abstract	第5-10页
1 绪论	第10-15页
·介词短语识别的意义	第10-11页
·介词短语识别的难点	第11-12页
·有关介词短语的研究	第12-13页
·本文所做的工作	第13-15页
2 理论背景	第15-23页
·自然语言处理	第15-16页
·浅层句法分析	第16页
·统计模型概述	第16-18页
·规则方法的概率化	第18-19页
·统计模型在浅层句法分析中的应用	第19-21页
·数据平滑方法	第21-23页
3 介词短语的标注规范	第23-28页
·介词的定义	第23-24页
·介词短语的标注规范	第24-27页
·介词短语识别	第27-28页
4 基于最大熵的介词短语识别	第28-38页
·自然语言处理中的最大熵模型介绍	第28-31页
·一个简单例子	第28-30页
·最大熵模型框架描述	第30-31页
·特征	第31-35页
·特征的表示方法	第31-32页
·影响介词短语识别的语言特征	第32-33页
·特征的获取	第33-34页
·特征选择	第34-35页
·参数估计	第35-37页
·GIS算法	第35-36页
·IIS算法	第36-37页
·嵌套关系处理	第37-38页
5 汉语介词短语识别系统实现	第38-44页
·汉语介词短语识别系统的工程环境	第38-39页
·开发环境简介	第38页
·汉语介词短语识别系统和NiHao翻译系统的关系	第38-39页
·多类划分标记	第39-40页
·系统结构	第40-41页
·汉语介词短语识别系统的详细流程	第41-44页
6 实验结果分析	第44-51页
·语料说明	第44页
·实验结果	第44-45页
·训练语料规模对实验的影响	第45-46页
·实验数据比较	第46-47页
·错误分析	第47-51页
结论	第51-52页
参考文献	第52-54页
附录A 部分识别结果	第54-57页
攻读硕士学位期间发表学术论文情况	第57-58页
致谢	第58-59页
大连理工大学学位论文版权使用授权书	第59页