基于自然语言处理的多源POI数据融合的研究

摘要	第6-8页
Abstract	第8-9页
1 引言	第13-18页
1.1 研究背景和意义	第13-14页
1.2 国内外研究现状	第14-15页
1.3 本文主要研究问题和内容	第15-16页
1.4 本文的章节安排	第16-18页
2 机器学习的分类模型	第18-29页
2.1 k-近邻算法	第18-21页
2.1.1 KNN 算法	第18-20页
2.1.2 距离加权最近邻算法	第20页
2.1.3 k-近邻的两个实践问题	第20-21页
2.2 决策树 C4.5	第21-24页
2.2.1 决策树简介	第21-22页
2.2.2 ID3 算法	第22-23页
2.2.3 C4.5 算法	第23-24页
2.3 强分类器 AdaBoost	第24-26页
2.3.1 Adaboost 的基本算法	第25-26页
2.4 评估方法	第26页
2.5 Weka 简介	第26-28页
2.6 小结	第28-29页
3 基于各字段相似度的 POI 匹配	第29-46页
3.1 名称相似度	第29-32页
3.1.1 莱文史特距离算法	第29-30页
3.1.2 Jaccard 相似方法	第30页
3.1.3 Jaro 距离算法	第30页
3.1.4 字符串分词处理	第30-32页
3.2 地理信息的相似度	第32-37页
3.2.1 中文地址的相似度	第32-37页
3.2.2 空间地理信息相似度	第37页
3.3 国内经纬度的统一	第37-43页
3.3.1 问题描述	第37-40页
3.3.2 基于纠偏表的实现	第40-41页
3.3.3 基于 API 的实现	第41-43页
3.4 各字段匹配结果	第43-45页
3.4.1 字符串相似算法之间的比较	第43-44页
3.4.2 POI 的三个特征之间的比较	第44-45页
3.5 小结	第45-46页
4 可融合 POI 的分类	第46-56页
4.1 问题描述	第46-47页
4.2 基于规则的分类	第47-52页
4.2.1 分类模型	第47-49页
4.2.2 实验数据介绍	第49-50页
4.2.3 分类结果级分析	第50-52页
4.3 基于机器学习的分类	第52-55页
4.3.1 POI 相似度表示	第52-53页
4.3.2 机器学习分类模型	第53页
4.3.3 机器学习模型训练与分类过程	第53-54页
4.3.4 实验结果及分析	第54-55页
4.4 小结	第55-56页
5 多源 POI 数据融合系统	第56-61页
5.1 多源 POI 数据融合系统的简介	第56-60页
5.1.1 系统流程	第56-58页
5.1.2 网络地图的选择	第58-59页
5.1.3 http 代理服务的使用	第59-60页
5.2 小结	第60-61页
6 总结与展望	第61-63页
6.1 总结	第61页
6.2 展望	第61-63页
参考文献	第63-66页
致谢	第66-67页
个人简历	第67页
学术论文	第67页
研究项目	第67-68页