基于角色标注的中文POI名称匹配的研究及原型系统实现
摘要 | 第1-6页 |
ABSTRACT | 第6-7页 |
第一章 绪论 | 第7-11页 |
·POI的概念 | 第7-8页 |
·什么叫POI | 第7页 |
·POI的内容和分类 | 第7-8页 |
·中文POI的构成特点 | 第8页 |
·地理编码的概念 | 第8-9页 |
·地理编码和POI匹配的关系 | 第9页 |
·研究背景与重点 | 第9-11页 |
第二章 中文分词的理论和算法 | 第11-23页 |
·中文分词概述 | 第11-12页 |
·中文分词的应用领域 | 第11-12页 |
·分词的必要性和意义 | 第12页 |
·分词的基本方法 | 第12-17页 |
·基于词典的分词方法 | 第12-15页 |
·基于统计的分词方法 | 第15-17页 |
·混合的分词方法 | 第17页 |
·常用的自动分词算法比较 | 第17-18页 |
·汉语分词面临的基本问题及其解决方法 | 第18-19页 |
·汉语自动分词的评测指标 | 第19-20页 |
·中文分词现有的成就 | 第20-21页 |
·分词研究理论进展 | 第20页 |
·几个优秀的分词系统 | 第20-21页 |
·中文分词和中文POI名称分词的关系 | 第21-22页 |
·中文POI名称分词和匹配的难点分析 | 第22页 |
·现有的分词和匹配技术的的不足 | 第22-23页 |
第三章 隐马尔柯夫模型 | 第23-30页 |
·马尔柯夫模型简述 | 第23-24页 |
·隐马尔柯夫模型 | 第24-26页 |
·HMM中的三个问题 | 第26页 |
·HMM三个基本问题的求解 | 第26-30页 |
第四章 角色的标注及匹配原理 | 第30-35页 |
·中文POI的角色构成 | 第30页 |
·基于N-最短路径的POI名称切分 | 第30-31页 |
·基本思想 | 第30页 |
·模型求解 | 第30-31页 |
·POI名称分词的切分岐义和新词处理 | 第31-32页 |
·切分岐义处理算法 | 第31-32页 |
·新词处理策略法 | 第32页 |
·角色标注的HMM | 第32-35页 |
·角色标注的算法实现 | 第33-34页 |
·基于角色标注的匹配规则 | 第34-35页 |
第五章 原型系统的设计和实现 | 第35-42页 |
·工具的选择 | 第35-37页 |
·分词处理流程 | 第37页 |
·系统的结构 | 第37-38页 |
·生成分词词典 | 第38页 |
·模型参数的训练 | 第38-40页 |
·角色标注实现 | 第40页 |
·Lucene建立索引和搜索原理 | 第40-41页 |
·主要接口介绍 | 第41-42页 |
第六章 结论与展望 | 第42-44页 |
·试验结果与分析 | 第42-43页 |
·分词结果分析 | 第42页 |
·匹配测试 | 第42-43页 |
·总结及工作展望 | 第43-44页 |
参考文献 | 第44-46页 |
附录A | 第46-50页 |
致谢 | 第50页 |