基地统计和规则的中文姓名识别系统的研制

第一章引言	第1-11页
1．1 自动分词在中文信息处理中的重要性	第7-8页
1．2 论文内容的提出	第8-9页
1．3 本文所做的工作	第9-11页
第二章识别中文姓名所用资源	第11-15页
2．1 中文姓名本身规律	第11-13页
2．1．1 中文姓名用字特点	第11-12页
2．1．2 名字用字分类	第12-13页
2．2 中文姓名前后文规律	第13-14页
2．3 姓名对分词的影响	第14-15页
第三章基于规则中文姓名识别模型	第15-25页
3．1 规则识别模型的基本思想	第15-16页
3．2 潜在姓名汉字串的频率统计	第16-18页
3．2．1 汉字串频度计算方法	第16页
3．2．2 汉字串权值估算方法	第16-17页
3．2．3 汉字串频率统计示例	第17-18页
3．3 潜在姓名识别规则	第18-20页
3．3．1 识别规则描述图	第18-20页
3．3．2 词条信息特征值	第20页
3．4 算法描述	第20-25页
3．4．1 实现步骤	第20-23页
3．4．2 潜在姓后单词的具体分析	第23-25页
第四章基于统计中文姓名识别模型	第25-37页
4．1 统计策略概述	第25-26页
4．2 姓名用字可信度	第26-28页
4．3 构词可信度与接续可信度	第28-31页
4．3．1 汉字串构词可信度	第28-30页
4．3．2 接续可信度	第30-31页
4．4 句子切分正确可信度	第31-34页
4．4．1 切分的形式模型	第31-33页
4．4．2 切分可信度	第33-34页
4．5 含中文姓名识别的切分模型	第34-35页
4．6 算法描述	第35-37页
4．6．1 按姓名切分	第35-36页
4．6．2分析与学习	第36-37页
第五章两种模型实验结果与比较	第37-45页
5．1 规则模型的实验结果	第37-39页
5．1．1 系统流程	第37-38页
5．1．2 示例分析	第38-39页
5．2 统计模型的实验结果	第39-43页
5．3 两种模型优缺点比较	第43-45页
第六章结论与展望	第45-47页
6．1 结论	第45-46页
6．2 展望	第46-47页
致谢	第47-48页
参考文献	第48-50页
附录	第50-52页