首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于Chrome浏览器插件的爬虫系统

摘要第4-6页
ABSTRACT第6-7页
第一章 绪论第11-17页
    1.1 研究背景与意义第11-13页
    1.2 国内外研究现状第13-14页
    1.3 研究内容及研究目标第14-15页
    1.4 本文的组织结构第15-17页
第二章 相关技术介绍第17-31页
    2.1 网络爬虫技术与反爬虫策略第17-21页
        2.1.1 网络爬虫技术第17-19页
        2.1.2 反爬虫策略第19-21页
    2.2 Chrome浏览器介绍第21-22页
    2.3 Chrome扩展技术介绍第22-28页
        2.3.1 content_scripts第23-25页
        2.3.2 background第25页
        2.3.3 permissions第25-26页
        2.3.4 Chrome扩展页面间的通信第26-27页
        2.3.5 Chrome扩展举例第27-28页
    2.4 Netty框架与Spring框架第28-30页
        2.4.1 Netty框架第28-29页
        2.4.2 Spring第29-30页
    2.5 本章总结第30-31页
第三章 系统概要设计第31-38页
    3.1 系统需求分析第31-33页
        3.1.1 需求分析第31-33页
        3.1.2 系统目标第33页
    3.2 系统概要设计第33-37页
        3.2.1 信息抓取模块第34-35页
        3.2.2 中央服务器模块第35-36页
        3.2.3 主从数据库模块第36-37页
    3.3 本章小结第37-38页
第四章 系统详细设计第38-46页
    4.1 模块间交互设计第38页
    4.2 信息抓取模块第38-42页
        4.2.1 与中央服务器模块交互功能第39-40页
        4.2.2 页面信息提取第40页
        4.2.3 测试功能第40页
        4.2.4 待抓取页面管理第40-41页
        4.2.5 浏览器Tab管理第41页
        4.2.6 日志监控第41-42页
        4.2.7 信息抓取模块包设计第42页
    4.3 中央服务器模块第42-45页
        4.3.1 JDBC封装第42-43页
        4.3.2 Exception封装第43页
        4.3.3 参数验证第43页
        4.3.4 图片相关功能第43-44页
        4.3.5 数据去重第44页
        4.3.6 业务逻辑第44页
        4.3.7 测试功能第44-45页
    4.4 本章小结第45-46页
第五章 系统实现第46-57页
    5.1 系统实现概述第46-47页
    5.2 信息抓取模块第47-52页
        5.2.1 JQuery包第47-48页
        5.2.2 基础文件第48页
        5.2.3 后台运行文件第48页
        5.2.4 信息提取脚本第48-50页
        5.2.5 manifest.json配置第50-51页
        5.2.6 测试第51-52页
    5.3 中央服务器模块第52-54页
        5.3.1 共用功能第52页
        5.3.2 业务逻辑第52-53页
        5.3.3 测试第53-54页
    5.4 主从库模块第54-56页
        5.4.1 主库授予从库复制权限第54页
        5.4.2 修改主库的配置文件第54-55页
        5.4.3 修改从库的配置文件第55页
        5.4.4 从库启动复制第55页
        5.4.5 测试第55-56页
    5.5 本章小结第56-57页
第六章 系统验证第57-63页
    6.1 实验准备第57页
        6.1.1 实验环境第57页
        6.1.2 预期目标第57页
    6.2 信息抓取模块部署第57-58页
    6.3 结果验证第58-60页
    6.4 系统优缺点第60-61页
    6.5 本章小结第61-63页
第七章 总结与展望第63-65页
    7.1 总结第63-64页
    7.2 展望第64-65页
参考文献第65-68页
攻读学位期间的研究成果目录第68-69页
致谢第69页

论文共69页,点击 下载论文
上一篇:宏基因组学技术在病原体检测中的应用
下一篇:乌司他丁通过p38MAPK通路治疗脓毒症急性肝损伤的相关研究