中文姓名自动识别技术研究
声明 | 第1-3页 |
摘要 | 第3-4页 |
Abstract | 第4-7页 |
第一章 引言 | 第7-14页 |
1.1 自动分词在中文信息处理中的意义 | 第7-8页 |
1.2 本文内容的提出 | 第8-9页 |
1.3 中文姓名识别的难点 | 第9-10页 |
1.4 中文姓名自动识别研究现状与分析 | 第10-13页 |
1.5 本文所做的工作及创新点 | 第13-14页 |
第二章 中文姓名自动识别的数据资源 | 第14-19页 |
2.1 姓氏用字和名字用字情况分析 | 第14-17页 |
2.2 真实语料中中文姓名的上下文 | 第17-19页 |
第三章 隐马尔可夫模型及其在姓名自动识别中的应用 | 第19-27页 |
3.1 隐马尔可夫模型 | 第19-20页 |
3.2 中文姓名的构成角色 | 第20-22页 |
3.3 姓名识别模式集 | 第22-23页 |
3.4 中文姓名构成角色标注集的确定 | 第23页 |
3.5 HMM在姓名构成角色标注中的应用 | 第23-24页 |
3.6 Viterbi算法 | 第24-27页 |
第四章 中文姓名自动识别的方法和步骤 | 第27-39页 |
4.1 角色信息的自动抽取 | 第27-30页 |
4.1.1 推导过程 | 第27-29页 |
4.1.2 角色信息自动抽取算法 | 第29-30页 |
4.2 自动分词 | 第30-35页 |
4.2.1 自动分词算法回顾 | 第31-32页 |
4.2.2 一种改进的双向匹配法 | 第32-35页 |
4.3 角色标注过程 | 第35-37页 |
4.3.1 角色分裂处理 | 第35页 |
4.3.2 角色自动标注算法 | 第35-37页 |
4.4 中文姓名自动识别的流程 | 第37-39页 |
第五章 系统的实现及实验结果分析 | 第39-55页 |
5.1 系统要求 | 第39页 |
5.2 系统流程 | 第39-40页 |
5.3 系统结构 | 第40-43页 |
5.4 系统实现 | 第43-48页 |
5.4.1 主要数据结构 | 第43-45页 |
5.4.2 类定义 | 第45-48页 |
5.5 中文姓名识别的评测实验 | 第48-52页 |
5.5.1 评测集与评测指标 | 第48-49页 |
5.5.2 系统识别中文姓名示例及分析 | 第49-51页 |
5.5.3 评测实验及结果分析 | 第51-52页 |
5.6 冲突分析 | 第52-55页 |
5.6.1 冲突的定义 | 第52-53页 |
5.6.2 冲突的类型 | 第53-55页 |
第六章 结论与展望 | 第55-56页 |
致谢 | 第56-57页 |
附录 | 第57-59页 |
参考文献 | 第59-62页 |