网站文本数据采集系统的设计与实现

致谢	第5-6页
摘要	第6-7页
ABSTRACT	第7-8页
1 引言	第11-15页
1.1 项目研究意义	第11-12页
1.2 国内外发展现状	第12-13页
1.3 个人工作内容	第13页
1.4 论文的组织结构	第13-15页
2 相关技术综述	第15-21页
2.1 QUI前端展示框架	第15页
2.2 Struts2框架	第15-16页
2.3 Spring框架	第16-17页
2.4 正则表达式	第17页
2.5 HttpClient	第17-18页
2.6 PhantomJS	第18页
2.7 Redis	第18-19页
2.8 本章小结	第19-21页
3 网站文本数据采集系统需求分析	第21-27页
3.1 系统建设目标	第21-22页
3.2 功能性需求分析	第22-24页
3.2.1 爬虫资源配置与监控平台的需求分析	第22-23页
3.2.2 爬虫抓取信息平台的需求分析	第23-24页
3.3 非功能性需求分析	第24-25页
3.4 其它需求说明	第25页
3.5 本章小结	第25-27页
4 网站文本数据采集系统的概要设计	第27-47页
4.1 系统架构设计	第27-34页
4.1.1 架构整体设计	第27-29页
4.1.2 爬虫资源配置与监控平台	第29-31页
4.1.3 爬虫抓取信息平台	第31-34页
4.2 系统功能设计	第34-38页
4.2.1 爬虫资源配置与监控平台	第34-37页
4.2.2 爬虫抓取信息平台	第37-38页
4.3 系统数据库设计	第38-46页
4.3.1 数据库概念结构设计	第38-39页
4.3.2 数据库物理结构设计	第39-46页
4.4 本章小结	第46-47页
5 网站文本数据采集系统的详细设计与实现	第47-73页
5.1 爬虫资源配置与监控平台	第47-62页
5.1.1 主要界面设计	第47-50页
5.1.2 网站完整信息配置	第50-51页
5.1.3 频道添加	第51-54页
5.1.4 模板添加与测试	第54-56页
5.1.5 种子自动添加	第56-58页
5.1.6 导出脚本	第58-62页
5.2 爬虫抓取信息平台	第62-71页
5.2.1 环形队列	第62-63页
5.2.2 种子加载	第63-65页
5.2.3 网页下载	第65-67页
5.2.4 网页解析	第67-69页
5.2.5 存储	第69-71页
5.3 本章小结	第71-73页
6 系统验证	第73-81页
6.1 系统业务功能验证	第73-79页
6.2 系统性能验证	第79-80页
6.3 本章小结	第80-81页
7 结论	第81-83页
7.1 全文总结	第81页
7.2 不足与展望	第81-83页
参考文献	第83-85页
作者简历及攻读硕士专业学位期间取得的研究成果	第85-87页
学位论文数据集	第87页