首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于互联网位置服务的文本信息搜索技术研究

摘要第5-6页
Abstract第6页
第1章 绪论第9-15页
    1.1 课题的目的和意义第9-10页
    1.2 国内外研究现状第10-12页
        1.2.1 WEB正文信息提取研究现状第10-11页
        1.2.2 地理文本信息解析的现状第11-12页
    1.3 论文工作第12-15页
第2章 相关概念与技术第15-23页
    2.1 百度地图API第15页
    2.2 WEB信息提取相关工作第15-17页
        2.2.1 基于DOM树的信息提取方法第15-16页
        2.2.2 基于网页分割找正文块方法第16页
        2.2.3 基于标记窗的信息提取方法第16页
        2.2.4 基于数据挖掘或者机器学习的信息提取方法第16-17页
        2.2.5 基于逻辑行和最大接纳距离的网页正文抽取方法第17页
    2.3 JsouP介绍第17-21页
        2.3.0 Jsoup概述第17-18页
        2.3.1 Jsoup的基本功能第18-19页
        2.3.2 Jsoup项目的部分成果第19页
        2.3.3 相关技术介绍第19-21页
    2.4 本章小结第21-23页
第3章 互联网文本信息提取第23-41页
    3.1 基于百度API的信息提取第23-28页
        3.1.1 设计思路第23页
        3.1.2 数据源的采集第23-24页
        3.1.3 功能实现第24-28页
    3.2 基于JSOUP的WEB信息抽取技术方法第28-32页
        3.2.1 系统介绍第28-29页
        3.2.2 URL的收集第29-31页
        3.2.3 基于Jsoup的页面爬取第31-32页
    3.3 实验分析第32-40页
        3.3.1 网页结构的分析第32-33页
        3.3.2 总体框架第33页
        3.3.3 数据转换第33-35页
        3.3.4 数据抽取第35-36页
        3.3.5 数据清洗第36-37页
        3.3.6 实验与测试第37-39页
        3.3.7 实验分析第39-40页
    3.4 本章小结第40-41页
第4章 地理位置文本信息解析第41-49页
    4.1 中文地址第41-42页
    4.2 地理文本信息解析第42-45页
        4.2.1 分词算法第42-43页
        4.2.2 地址匹配第43页
        4.2.3 信任度解析算法第43-44页
        4.2.4 实验结果第44-45页
    4.3 数据转换第45-47页
    4.4 本章小结第47-49页
第5章 总结与展望第49-51页
参考文献第51-55页
攻读硕士学位期间已撰写和发表的论文第55-57页
致谢第57页

论文共57页,点击 下载论文
上一篇:海底电磁采集站数据管理软件设计与开发
下一篇:高中地理五步教学模式的研究