首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--自动化系统论文--数据处理、数据处理系统论文

基于网络爬虫互联网涉税信息采集系统设计与实现

摘要第5-7页
abstract第7-8页
第一章 绪论第11-15页
    1.1 课题研究背景及意义第11-12页
    1.2 国内外研究现状第12-13页
        1.2.1 国外研究现状第12页
        1.2.2 国内研究现状第12-13页
    1.3 本课题主要研究内容第13页
    1.4 论文的组织结构第13-15页
第二章 相关理论及技术第15-31页
    2.1 网络爬虫原理第15-16页
    2.2 网络爬虫类型第16-18页
    2.3 Ajax与网络爬虫第18-19页
    2.4 信息抽取第19-22页
    2.5 J2EE关键技术第22-25页
        2.5.1 Spring技术第22-24页
        2.5.2 Struts技术第24-25页
    2.6 JDBC介绍第25-26页
    2.7 正则表达式第26-27页
    2.8 URL去重第27-29页
        2.8.1 URL去重种类第27-28页
        2.8.2 布隆过滤器算法第28-29页
    2.9 MYSQL关系型数据库第29页
    2.10 本章小结第29-31页
第三章 系统需求分析与架构设计第31-37页
    3.1 系统功能需求分析第31页
    3.2 建设内容第31-32页
    3.3 互联网数据采集工作流程第32-33页
    3.4 涉税信息采集系统特性要求第33页
    3.5 系统总体结构第33-34页
    3.6 网页抓取模块第34-35页
    3.7 页面解析模块第35-36页
    3.8 MYSQL数据库模块第36页
    3.9 本章小结第36-37页
第四章 网络爬虫系统实现第37-53页
    4.1 爬虫初始化第37-38页
    4.2 网页抓取模块第38-47页
        4.2.1 Robot协议分析第38-40页
        4.2.2 HTTP协议第40-41页
        4.2.3 网页抓取过程第41-43页
        4.2.4 URL去重第43-47页
    4.3 网页解析模块第47-49页
    4.4 判断主题相关度第49页
    4.5 存储页面信息第49-50页
    4.6 多线程的实现第50页
    4.7 数据库设计第50-52页
        4.7.1 数据库表概念结构设计第50-51页
        4.7.2 数据库表逻辑结构设计第51-52页
    4.8 本章小结第52-53页
第五章 系统应用场景及测试分析第53-63页
    5.1 应用场景第53页
    5.2 测试用例第53-62页
    5.3 本章小结第62-63页
第六章 全文总结和展望第63-65页
    6.1 全文总结第63-64页
    6.2 后续工作展望第64-65页
致谢第65-66页
参考文献第66-68页

论文共68页,点击 下载论文
上一篇:时尚类微信公众号运营策略研究--以“杜绍斐”为例
下一篇:氧化生产线数据采集及信息化系统设计与实现