汉语组块识别的研究
| 摘要 | 第1-6页 |
| Abstract | 第6-10页 |
| 1 绪论 | 第10-17页 |
| ·自然语言理解概述 | 第10页 |
| ·组块的提出 | 第10-11页 |
| ·组块识别的研究现状 | 第11-15页 |
| ·组块识别的研究意义 | 第15-16页 |
| ·本文的工作 | 第16-17页 |
| 2 组块的定义和标注方法 | 第17-25页 |
| ·组块的定义 | 第17-19页 |
| ·组块类型 | 第19-24页 |
| ·名词组块 | 第19-21页 |
| ·动词组块 | 第21-22页 |
| ·形容词组块 | 第22页 |
| ·副词组块 | 第22页 |
| ·介词组块 | 第22-23页 |
| ·连词组块 | 第23页 |
| ·数量词组块 | 第23页 |
| ·时间词组块 | 第23页 |
| ·方位词组块 | 第23页 |
| ·感叹词组块 | 第23页 |
| ·非组块成分 | 第23-24页 |
| ·组块的标注规范 | 第24-25页 |
| 3 基于增益HMM的组块识别 | 第25-34页 |
| ·HMM模型介绍 | 第25-29页 |
| ·HMM统计语言模型概述 | 第25-26页 |
| ·模型参数训练 | 第26-27页 |
| ·参数平滑 | 第27-28页 |
| ·标注算法 | 第28-29页 |
| ·基于增益HMM的组块识别模型 | 第29-34页 |
| ·增益的HMM模型 | 第29-31页 |
| ·组块标注过程 | 第31-34页 |
| 4 基于SVM的组块识别 | 第34-44页 |
| ·SVM模型介绍 | 第34-40页 |
| ·最优分类超平面 | 第34-36页 |
| ·线性SVM | 第36-37页 |
| ·非线性SVM | 第37-38页 |
| ·多类划分 | 第38-39页 |
| ·SVM的训练算法 | 第39-40页 |
| ·基于SVM的汉语组块识别模型 | 第40-44页 |
| ·特征选取 | 第40-41页 |
| ·模型构建 | 第41-44页 |
| 5 错误驱动学习 | 第44-47页 |
| ·错误驱动学习的过程 | 第44-46页 |
| ·规则集 | 第46-47页 |
| 6 组块识别的结果与分析 | 第47-54页 |
| ·实验数据说明 | 第47页 |
| ·评价参数的定义与获取 | 第47-48页 |
| ·评价参数 | 第47页 |
| ·评价参数的获取 | 第47-48页 |
| ·实验结果及分析 | 第48-54页 |
| ·基于增益HMM的组块识别结果 | 第48-50页 |
| ·基于SVM的组块识别结果 | 第50-51页 |
| ·错误驱动校正后的结果 | 第51-52页 |
| ·实验结果分析 | 第52-54页 |
| 结论 | 第54-56页 |
| 参考文献 | 第56-59页 |
| 附录A 北大2001词性标注集 | 第59-61页 |
| 攻读硕士学位期间发表学术论文情况 | 第61-62页 |
| 致谢 | 第62-63页 |
| 大连理工大学学位论文版权使用授权书 | 第63页 |