基于CRF的中文地名识别研究
| 摘要 | 第1-5页 |
| Abstract | 第5-9页 |
| 1 绪论 | 第9-14页 |
| ·研究的背景及意义 | 第9页 |
| ·中文地名识别 | 第9-11页 |
| ·中文地名识别的作用 | 第10页 |
| ·中文地名识别的特点 | 第10-11页 |
| ·系统评测和技术水平 | 第11页 |
| ·命名实体识别的方法 | 第11-13页 |
| ·基于规则的方法 | 第11-12页 |
| ·基于统计的方法 | 第12页 |
| ·规则和统计相结合的方法 | 第12-13页 |
| ·存在的问题 | 第13页 |
| ·本文的工作 | 第13-14页 |
| 2 统计机器学习模型 | 第14-21页 |
| ·隐马尔可夫模型(HMM) | 第14-15页 |
| ·最大熵模型(ME) | 第15-16页 |
| ·条件随机场模型(CRF) | 第16-18页 |
| ·支持向量机模型(SVM) | 第18-21页 |
| 3 基于CRF的地名识别 | 第21-31页 |
| ·BIO分类标记 | 第21页 |
| ·地名特征 | 第21-23页 |
| ·建立训练集和测试集 | 第23-24页 |
| ·特征模板 | 第24-26页 |
| ·特征模板的类型 | 第24-25页 |
| ·特征模板项的类型 | 第25页 |
| ·特征模板的选取 | 第25-26页 |
| ·基于CRF的中文地名识别 | 第26-31页 |
| ·基于CRF模型对训练集进行训练 | 第26-29页 |
| ·使用模型进行测试 | 第29-31页 |
| 4 基于CRF与SVM的地名识别 | 第31-35页 |
| ·基于SVM的地名识别 | 第31-32页 |
| ·CRF与SVM相结合的地名识别 | 第32-35页 |
| 5 CRF与规则相结合的地名识别 | 第35-42页 |
| ·建立规则资源库 | 第35-38页 |
| ·地名的外部规则资源 | 第35-37页 |
| ·地名内部规则资源 | 第37-38页 |
| ·规则库的建立 | 第38-41页 |
| ·获取前后词搭配规则 | 第38-39页 |
| ·修正规则 | 第39-41页 |
| ·CRF与规则相结合的地名识别 | 第41-42页 |
| 6 实验结果 | 第42-51页 |
| ·特征模板的选择 | 第42-45页 |
| ·构建候选特征模板项集 | 第43-44页 |
| ·筛选特征模板项 | 第44-45页 |
| ·CRF与SVM相结合的地名识别 | 第45页 |
| ·CRF与规则相结合的地名识别 | 第45-46页 |
| ·几种地名识别方法比较 | 第46-47页 |
| ·与其它文献比较 | 第47-48页 |
| ·单纯CRF的地名识别结果比较 | 第47页 |
| ·基于规则修正后的结果比较 | 第47-48页 |
| ·结果分析 | 第48-51页 |
| ·正确识别结果分析 | 第48-50页 |
| ·错误识别结果分析 | 第50-51页 |
| 结论 | 第51-53页 |
| 参考文献 | 第53-57页 |
| 致谢 | 第57-59页 |