基于互联网位置服务的文本信息搜索技术研究

摘要	第5-6页
Abstract	第6页
第1章绪论	第9-15页
1.1 课题的目的和意义	第9-10页
1.2 国内外研究现状	第10-12页
1.2.1 WEB正文信息提取研究现状	第10-11页
1.2.2 地理文本信息解析的现状	第11-12页
1.3 论文工作	第12-15页
第2章相关概念与技术	第15-23页
2.1 百度地图API	第15页
2.2 WEB信息提取相关工作	第15-17页
2.2.1 基于DOM树的信息提取方法	第15-16页
2.2.2 基于网页分割找正文块方法	第16页
2.2.3 基于标记窗的信息提取方法	第16页
2.2.4 基于数据挖掘或者机器学习的信息提取方法	第16-17页
2.2.5 基于逻辑行和最大接纳距离的网页正文抽取方法	第17页
2.3 JsouP介绍	第17-21页
2.3.0 Jsoup概述	第17-18页
2.3.1 Jsoup的基本功能	第18-19页
2.3.2 Jsoup项目的部分成果	第19页
2.3.3 相关技术介绍	第19-21页
2.4 本章小结	第21-23页
第3章互联网文本信息提取	第23-41页
3.1 基于百度API的信息提取	第23-28页
3.1.1 设计思路	第23页
3.1.2 数据源的采集	第23-24页
3.1.3 功能实现	第24-28页
3.2 基于JSOUP的WEB信息抽取技术方法	第28-32页
3.2.1 系统介绍	第28-29页
3.2.2 URL的收集	第29-31页
3.2.3 基于Jsoup的页面爬取	第31-32页
3.3 实验分析	第32-40页
3.3.1 网页结构的分析	第32-33页
3.3.2 总体框架	第33页
3.3.3 数据转换	第33-35页
3.3.4 数据抽取	第35-36页
3.3.5 数据清洗	第36-37页
3.3.6 实验与测试	第37-39页
3.3.7 实验分析	第39-40页
3.4 本章小结	第40-41页
第4章地理位置文本信息解析	第41-49页
4.1 中文地址	第41-42页
4.2 地理文本信息解析	第42-45页
4.2.1 分词算法	第42-43页
4.2.2 地址匹配	第43页
4.2.3 信任度解析算法	第43-44页
4.2.4 实验结果	第44-45页
4.3 数据转换	第45-47页
4.4 本章小结	第47-49页
第5章总结与展望	第49-51页
参考文献	第51-55页
攻读硕士学位期间已撰写和发表的论文	第55-57页
致谢	第57页