基于最大熵的汉语介词短语自动识别
| 摘要 | 第1-5页 |
| Abstract | 第5-10页 |
| 1 绪论 | 第10-15页 |
| ·介词短语识别的意义 | 第10-11页 |
| ·介词短语识别的难点 | 第11-12页 |
| ·有关介词短语的研究 | 第12-13页 |
| ·本文所做的工作 | 第13-15页 |
| 2 理论背景 | 第15-23页 |
| ·自然语言处理 | 第15-16页 |
| ·浅层句法分析 | 第16页 |
| ·统计模型概述 | 第16-18页 |
| ·规则方法的概率化 | 第18-19页 |
| ·统计模型在浅层句法分析中的应用 | 第19-21页 |
| ·数据平滑方法 | 第21-23页 |
| 3 介词短语的标注规范 | 第23-28页 |
| ·介词的定义 | 第23-24页 |
| ·介词短语的标注规范 | 第24-27页 |
| ·介词短语识别 | 第27-28页 |
| 4 基于最大熵的介词短语识别 | 第28-38页 |
| ·自然语言处理中的最大熵模型介绍 | 第28-31页 |
| ·一个简单例子 | 第28-30页 |
| ·最大熵模型框架描述 | 第30-31页 |
| ·特征 | 第31-35页 |
| ·特征的表示方法 | 第31-32页 |
| ·影响介词短语识别的语言特征 | 第32-33页 |
| ·特征的获取 | 第33-34页 |
| ·特征选择 | 第34-35页 |
| ·参数估计 | 第35-37页 |
| ·GIS算法 | 第35-36页 |
| ·IIS算法 | 第36-37页 |
| ·嵌套关系处理 | 第37-38页 |
| 5 汉语介词短语识别系统实现 | 第38-44页 |
| ·汉语介词短语识别系统的工程环境 | 第38-39页 |
| ·开发环境简介 | 第38页 |
| ·汉语介词短语识别系统和NiHao翻译系统的关系 | 第38-39页 |
| ·多类划分标记 | 第39-40页 |
| ·系统结构 | 第40-41页 |
| ·汉语介词短语识别系统的详细流程 | 第41-44页 |
| 6 实验结果分析 | 第44-51页 |
| ·语料说明 | 第44页 |
| ·实验结果 | 第44-45页 |
| ·训练语料规模对实验的影响 | 第45-46页 |
| ·实验数据比较 | 第46-47页 |
| ·错误分析 | 第47-51页 |
| 结论 | 第51-52页 |
| 参考文献 | 第52-54页 |
| 附录A 部分识别结果 | 第54-57页 |
| 攻读硕士学位期间发表学术论文情况 | 第57-58页 |
| 致谢 | 第58-59页 |
| 大连理工大学学位论文版权使用授权书 | 第59页 |