面向网络文本地理信息的POI获取技术研究

摘要	第5-6页
abstract	第6-7页
第1章绪论	第10-15页
1.1 研究背景及意义	第10-11页
1.2 国内外研究现状	第11-13页
1.3 本文主要内容	第13页
1.4 本文结构安排	第13-15页
第2章基于主题网络爬虫的POI敏感网页获取	第15-37页
2.1 主题网络爬虫	第15-21页
2.1.1 主题网络爬虫结构	第15-17页
2.1.2 主题网络爬虫表示模型	第17-18页
2.1.3 主题网络爬虫搜索策略	第18-21页
2.2 主题网络爬虫改进	第21-26页
2.2.1 网页特征向量生成算法改进	第21-24页
2.2.2 主题相关度判定方法改进	第24-26页
2.3 POI敏感网页的获取	第26-30页
2.3.1 种子URL选取	第26-27页
2.3.2 主题向量设定	第27-29页
2.3.3 敏感网页获取	第29-30页
2.4 网页DOM解析	第30-32页
2.5 实验与分析	第32-36页
2.5.1 实验内容	第32页
2.5.2 结果分析	第32-36页
2.6 本章小结	第36-37页
第3章 POI信息的识别与关联解析	第37-62页
3.1 命名实体识别	第37-42页
3.1.1 命名实体识别难点	第37页
3.1.2 命名实体识别方法	第37-38页
3.1.3 条件随机场模型	第38-42页
3.2 基于条件随机场的POI信息识别	第42-46页
3.2.1 识别所需资源	第42页
3.2.2 标记集选取	第42-43页
3.2.3 语料转化	第43页
3.2.4 特征集选取	第43-45页
3.2.5 POI信息识别流程	第45-46页
3.3 基于地址模型的地址识别	第46-49页
3.3.1 地址模型创建	第46-47页
3.3.2 地址识别	第47-49页
3.4 POI信息关联与解析	第49-56页
3.4.1 POI信息关联	第49-53页
3.4.2 POI信息解析	第53-56页
3.5 实验与分析	第56-61页
3.5.1 实验内容	第56-57页
3.5.2 结果分析	第57-61页
3.6 本章小结	第61-62页
第4章 POI实例获取与评估	第62-69页
4.1 POI敏感网页获取	第62-64页
4.2 POI信息识别	第64-65页
4.3 POI信息关联与解析	第65-66页
4.4 结果评估	第66-69页
结论	第69-70页
参考文献	第70-74页
攻读硕士学位期间发表的论文和取得的科研成果	第74-75页
致谢	第75页