基于角色标注的中文POI名称匹配的研究及原型系统实现
| 摘要 | 第1-6页 |
| ABSTRACT | 第6-7页 |
| 第一章 绪论 | 第7-11页 |
| ·POI的概念 | 第7-8页 |
| ·什么叫POI | 第7页 |
| ·POI的内容和分类 | 第7-8页 |
| ·中文POI的构成特点 | 第8页 |
| ·地理编码的概念 | 第8-9页 |
| ·地理编码和POI匹配的关系 | 第9页 |
| ·研究背景与重点 | 第9-11页 |
| 第二章 中文分词的理论和算法 | 第11-23页 |
| ·中文分词概述 | 第11-12页 |
| ·中文分词的应用领域 | 第11-12页 |
| ·分词的必要性和意义 | 第12页 |
| ·分词的基本方法 | 第12-17页 |
| ·基于词典的分词方法 | 第12-15页 |
| ·基于统计的分词方法 | 第15-17页 |
| ·混合的分词方法 | 第17页 |
| ·常用的自动分词算法比较 | 第17-18页 |
| ·汉语分词面临的基本问题及其解决方法 | 第18-19页 |
| ·汉语自动分词的评测指标 | 第19-20页 |
| ·中文分词现有的成就 | 第20-21页 |
| ·分词研究理论进展 | 第20页 |
| ·几个优秀的分词系统 | 第20-21页 |
| ·中文分词和中文POI名称分词的关系 | 第21-22页 |
| ·中文POI名称分词和匹配的难点分析 | 第22页 |
| ·现有的分词和匹配技术的的不足 | 第22-23页 |
| 第三章 隐马尔柯夫模型 | 第23-30页 |
| ·马尔柯夫模型简述 | 第23-24页 |
| ·隐马尔柯夫模型 | 第24-26页 |
| ·HMM中的三个问题 | 第26页 |
| ·HMM三个基本问题的求解 | 第26-30页 |
| 第四章 角色的标注及匹配原理 | 第30-35页 |
| ·中文POI的角色构成 | 第30页 |
| ·基于N-最短路径的POI名称切分 | 第30-31页 |
| ·基本思想 | 第30页 |
| ·模型求解 | 第30-31页 |
| ·POI名称分词的切分岐义和新词处理 | 第31-32页 |
| ·切分岐义处理算法 | 第31-32页 |
| ·新词处理策略法 | 第32页 |
| ·角色标注的HMM | 第32-35页 |
| ·角色标注的算法实现 | 第33-34页 |
| ·基于角色标注的匹配规则 | 第34-35页 |
| 第五章 原型系统的设计和实现 | 第35-42页 |
| ·工具的选择 | 第35-37页 |
| ·分词处理流程 | 第37页 |
| ·系统的结构 | 第37-38页 |
| ·生成分词词典 | 第38页 |
| ·模型参数的训练 | 第38-40页 |
| ·角色标注实现 | 第40页 |
| ·Lucene建立索引和搜索原理 | 第40-41页 |
| ·主要接口介绍 | 第41-42页 |
| 第六章 结论与展望 | 第42-44页 |
| ·试验结果与分析 | 第42-43页 |
| ·分词结果分析 | 第42页 |
| ·匹配测试 | 第42-43页 |
| ·总结及工作展望 | 第43-44页 |
| 参考文献 | 第44-46页 |
| 附录A | 第46-50页 |
| 致谢 | 第50页 |