基于统计和规则的中文地址分词系统设计与实现

摘要	第5-6页
Abstract	第6-7页
第一章绪论	第10-15页
1.1 论文研究背景与意义	第10页
1.2 研究现状	第10-13页
1.2.1 地址匹配研究现状	第10-11页
1.2.2 中文分词研究现状	第11-13页
1.3 论文的主要工作	第13页
1.4 论文组织结构	第13-15页
第二章中文地址分词相关理论及技术	第15-24页
2.1 中文分词主要方法	第15-17页
2.1.1 基于字典匹配的分词方法	第15-16页
2.1.2 基于统计的分词方法	第16-17页
2.1.3 基于理解的分词方法	第17页
2.2 中文分词主要难点	第17-18页
2.2.1 切分歧义问题	第17-18页
2.2.2 未登录词问题	第18页
2.3 相关统计学模型	第18-23页
2.3.1 隐马尔科夫模型(HMM)	第19页
2.3.2 最大熵模型(MEMM)	第19-20页
2.3.3 条件随机场模型(CRF)	第20-23页
2.4 本章小结	第23-24页
第三章基于标准地址模型的知识库构建	第24-34页
3.1 标准地址模型的研究	第24-27页
3.1.1 中文地址组成特点	第24-25页
3.1.2 标准地址模型的设计	第25-27页
3.2 行政区划等级库和特征词库的构建	第27-29页
3.3 基于条件随机场的实体识别模型的构建	第29-33页
3.3.1 基于条件随机场的实体识别模型	第30-31页
3.3.2 特征选择	第31-32页
3.3.3 特征模板设计	第32-33页
3.4 本章小结	第33-34页
第四章中文地址分词算法选取与设计	第34-42页
4.1 双数组trie树分词算法	第34-35页
4.2 基于地址组成规则的分词结果处理算法	第35-41页
4.2.1 行政区划地址部分的处理	第36-38页
4.2.2 详细地址处理	第38-41页
4.3 本章小结	第41-42页
第五章中文地址分词系统的实现	第42-53页
5.1 中文地址分词系统的框架	第42页
5.2 分词知识库的加载和初始化	第42-47页
5.2.1 行政区划等级库的加载和初始化	第42-45页
5.2.2 特征词库的加载和反序列化	第45-46页
5.2.3 实体识别模型文件的加载	第46-47页
5.3 双数组trie树分词的实现	第47-48页
5.4 基于地址组成规则的分词结果处理算法的实现	第48-52页
5.4.1 行政区划地址部分处理算法的实现	第49-50页
5.4.2 详细地址部分处理算法的实现	第50-52页
5.5 本章小结	第52-53页
第六章系统测试与结果分析	第53-58页
6.1 测试环境	第53页
6.2 实体识别模型的测试	第53-55页
6.3 分词系统的测试	第55-57页
6.3.1 性能测试	第55-56页
6.3.2 功能测试	第56-57页
6.4 本章小结	第57-58页
第七章总结与展望	第58-60页
7.1 全文工作总结	第58页
7.2 展望	第58-60页
致谢	第60-61页
参考文献	第61-63页