基于最大熵的汉语介词短语自动识别
摘要 | 第1-5页 |
Abstract | 第5-10页 |
1 绪论 | 第10-15页 |
·介词短语识别的意义 | 第10-11页 |
·介词短语识别的难点 | 第11-12页 |
·有关介词短语的研究 | 第12-13页 |
·本文所做的工作 | 第13-15页 |
2 理论背景 | 第15-23页 |
·自然语言处理 | 第15-16页 |
·浅层句法分析 | 第16页 |
·统计模型概述 | 第16-18页 |
·规则方法的概率化 | 第18-19页 |
·统计模型在浅层句法分析中的应用 | 第19-21页 |
·数据平滑方法 | 第21-23页 |
3 介词短语的标注规范 | 第23-28页 |
·介词的定义 | 第23-24页 |
·介词短语的标注规范 | 第24-27页 |
·介词短语识别 | 第27-28页 |
4 基于最大熵的介词短语识别 | 第28-38页 |
·自然语言处理中的最大熵模型介绍 | 第28-31页 |
·一个简单例子 | 第28-30页 |
·最大熵模型框架描述 | 第30-31页 |
·特征 | 第31-35页 |
·特征的表示方法 | 第31-32页 |
·影响介词短语识别的语言特征 | 第32-33页 |
·特征的获取 | 第33-34页 |
·特征选择 | 第34-35页 |
·参数估计 | 第35-37页 |
·GIS算法 | 第35-36页 |
·IIS算法 | 第36-37页 |
·嵌套关系处理 | 第37-38页 |
5 汉语介词短语识别系统实现 | 第38-44页 |
·汉语介词短语识别系统的工程环境 | 第38-39页 |
·开发环境简介 | 第38页 |
·汉语介词短语识别系统和NiHao翻译系统的关系 | 第38-39页 |
·多类划分标记 | 第39-40页 |
·系统结构 | 第40-41页 |
·汉语介词短语识别系统的详细流程 | 第41-44页 |
6 实验结果分析 | 第44-51页 |
·语料说明 | 第44页 |
·实验结果 | 第44-45页 |
·训练语料规模对实验的影响 | 第45-46页 |
·实验数据比较 | 第46-47页 |
·错误分析 | 第47-51页 |
结论 | 第51-52页 |
参考文献 | 第52-54页 |
附录A 部分识别结果 | 第54-57页 |
攻读硕士学位期间发表学术论文情况 | 第57-58页 |
致谢 | 第58-59页 |
大连理工大学学位论文版权使用授权书 | 第59页 |