具有中文人名识别功能的汉语自动分词算法研究
摘要 | 第1-4页 |
ABSTRACT | 第4-7页 |
第一章 绪论 | 第7-12页 |
§1-1 研究意义 | 第7页 |
§1-2 研究背景 | 第7-8页 |
§1-3 中文分词的特点 | 第8-9页 |
§1-4 分词的主要应用领域 | 第9-10页 |
§1-5 全文布局 | 第10-12页 |
第二章 中文分词技术现状 | 第12-21页 |
§2-1 汉语自动分词的难点 | 第12-13页 |
§2-2 中文人名识别的难点 | 第13页 |
§2-3 已有的中文分词方法 | 第13-16页 |
§2-4 已有的人名识别方法 | 第16-17页 |
§2-5 现有中文分词系统 | 第17-19页 |
§2-6 汉语自动分词的评测指标 | 第19-21页 |
第三章 歧义处理及人名识别 | 第21-36页 |
§3-1 本文要解决的问题 | 第21-23页 |
3-1-1 歧义字段切分问题 | 第21-23页 |
3-1-2 人名识别问题 | 第23页 |
§3-2 本文使用的主要方法 | 第23-26页 |
3-2-1 双向最大匹配法 | 第23-24页 |
3-2-2 改进后的双向最大匹配法 | 第24-25页 |
3-2-3 最大概率法 | 第25-26页 |
§3-3 歧义字段的采集及解决 | 第26-32页 |
3-3-1 歧义字段的采集 | 第26-27页 |
3-3-2 歧义字段的解决 | 第27-32页 |
§3-4 人名识别的实现 | 第32-36页 |
3-4-1 姓氏人名用字分析 | 第32-34页 |
3-4-2 姓名自动识别的基本步骤 | 第34-35页 |
3-4-3 本文姓名识别的基本步骤和方法 | 第35-36页 |
第四章 分词算法实现 | 第36-44页 |
§4-1 算法整体实现流程 | 第36-37页 |
§4-2 具体算法实现及流程 | 第37-44页 |
4-2-1 预处理过程 | 第37页 |
4-2-2 歧义采集过程主要算法及流程 | 第37-38页 |
4-2-3 歧义处理过程主要算法及流程 | 第38-42页 |
4-2-4 人名识别过程主要算法及流程 | 第42-44页 |
第五章 实验结果及分析 | 第44-51页 |
§5-1 实验结果及分析 | 第44-45页 |
§5-2 分词结果示例及分析 | 第45-51页 |
5-2-1 歧义采集结果示例及分析 | 第45-47页 |
5-2-2 人名识别结果示例及分析 | 第47-48页 |
5-2-3 本算法分词结果示例及分析 | 第48-51页 |
第六章 结论和展望 | 第51-52页 |
§6-1 本文结论 | 第51页 |
§6-2 展望 | 第51-52页 |
参考文献 | 第52-54页 |
致谢 | 第54页 |