基于Chrome浏览器插件的爬虫系统

摘要	第4-6页
ABSTRACT	第6-7页
第一章绪论	第11-17页
1.1 研究背景与意义	第11-13页
1.2 国内外研究现状	第13-14页
1.3 研究内容及研究目标	第14-15页
1.4 本文的组织结构	第15-17页
第二章相关技术介绍	第17-31页
2.1 网络爬虫技术与反爬虫策略	第17-21页
2.1.1 网络爬虫技术	第17-19页
2.1.2 反爬虫策略	第19-21页
2.2 Chrome浏览器介绍	第21-22页
2.3 Chrome扩展技术介绍	第22-28页
2.3.1 content_scripts	第23-25页
2.3.2 background	第25页
2.3.3 permissions	第25-26页
2.3.4 Chrome扩展页面间的通信	第26-27页
2.3.5 Chrome扩展举例	第27-28页
2.4 Netty框架与Spring框架	第28-30页
2.4.1 Netty框架	第28-29页
2.4.2 Spring	第29-30页
2.5 本章总结	第30-31页
第三章系统概要设计	第31-38页
3.1 系统需求分析	第31-33页
3.1.1 需求分析	第31-33页
3.1.2 系统目标	第33页
3.2 系统概要设计	第33-37页
3.2.1 信息抓取模块	第34-35页
3.2.2 中央服务器模块	第35-36页
3.2.3 主从数据库模块	第36-37页
3.3 本章小结	第37-38页
第四章系统详细设计	第38-46页
4.1 模块间交互设计	第38页
4.2 信息抓取模块	第38-42页
4.2.1 与中央服务器模块交互功能	第39-40页
4.2.2 页面信息提取	第40页
4.2.3 测试功能	第40页
4.2.4 待抓取页面管理	第40-41页
4.2.5 浏览器Tab管理	第41页
4.2.6 日志监控	第41-42页
4.2.7 信息抓取模块包设计	第42页
4.3 中央服务器模块	第42-45页
4.3.1 JDBC封装	第42-43页
4.3.2 Exception封装	第43页
4.3.3 参数验证	第43页
4.3.4 图片相关功能	第43-44页
4.3.5 数据去重	第44页
4.3.6 业务逻辑	第44页
4.3.7 测试功能	第44-45页
4.4 本章小结	第45-46页
第五章系统实现	第46-57页
5.1 系统实现概述	第46-47页
5.2 信息抓取模块	第47-52页
5.2.1 JQuery包	第47-48页
5.2.2 基础文件	第48页
5.2.3 后台运行文件	第48页
5.2.4 信息提取脚本	第48-50页
5.2.5 manifest.json配置	第50-51页
5.2.6 测试	第51-52页
5.3 中央服务器模块	第52-54页
5.3.1 共用功能	第52页
5.3.2 业务逻辑	第52-53页
5.3.3 测试	第53-54页
5.4 主从库模块	第54-56页
5.4.1 主库授予从库复制权限	第54页
5.4.2 修改主库的配置文件	第54-55页
5.4.3 修改从库的配置文件	第55页
5.4.4 从库启动复制	第55页
5.4.5 测试	第55-56页
5.5 本章小结	第56-57页
第六章系统验证	第57-63页
6.1 实验准备	第57页
6.1.1 实验环境	第57页
6.1.2 预期目标	第57页
6.2 信息抓取模块部署	第57-58页
6.3 结果验证	第58-60页
6.4 系统优缺点	第60-61页
6.5 本章小结	第61-63页
第七章总结与展望	第63-65页
7.1 总结	第63-64页
7.2 展望	第64-65页
参考文献	第65-68页
攻读学位期间的研究成果目录	第68-69页
致谢	第69页