首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

网站文本数据采集系统的设计与实现

致谢第5-6页
摘要第6-7页
ABSTRACT第7-8页
1 引言第11-15页
    1.1 项目研究意义第11-12页
    1.2 国内外发展现状第12-13页
    1.3 个人工作内容第13页
    1.4 论文的组织结构第13-15页
2 相关技术综述第15-21页
    2.1 QUI前端展示框架第15页
    2.2 Struts2框架第15-16页
    2.3 Spring框架第16-17页
    2.4 正则表达式第17页
    2.5 HttpClient第17-18页
    2.6 PhantomJS第18页
    2.7 Redis第18-19页
    2.8 本章小结第19-21页
3 网站文本数据采集系统需求分析第21-27页
    3.1 系统建设目标第21-22页
    3.2 功能性需求分析第22-24页
        3.2.1 爬虫资源配置与监控平台的需求分析第22-23页
        3.2.2 爬虫抓取信息平台的需求分析第23-24页
    3.3 非功能性需求分析第24-25页
    3.4 其它需求说明第25页
    3.5 本章小结第25-27页
4 网站文本数据采集系统的概要设计第27-47页
    4.1 系统架构设计第27-34页
        4.1.1 架构整体设计第27-29页
        4.1.2 爬虫资源配置与监控平台第29-31页
        4.1.3 爬虫抓取信息平台第31-34页
    4.2 系统功能设计第34-38页
        4.2.1 爬虫资源配置与监控平台第34-37页
        4.2.2 爬虫抓取信息平台第37-38页
    4.3 系统数据库设计第38-46页
        4.3.1 数据库概念结构设计第38-39页
        4.3.2 数据库物理结构设计第39-46页
    4.4 本章小结第46-47页
5 网站文本数据采集系统的详细设计与实现第47-73页
    5.1 爬虫资源配置与监控平台第47-62页
        5.1.1 主要界面设计第47-50页
        5.1.2 网站完整信息配置第50-51页
        5.1.3 频道添加第51-54页
        5.1.4 模板添加与测试第54-56页
        5.1.5 种子自动添加第56-58页
        5.1.6 导出脚本第58-62页
    5.2 爬虫抓取信息平台第62-71页
        5.2.1 环形队列第62-63页
        5.2.2 种子加载第63-65页
        5.2.3 网页下载第65-67页
        5.2.4 网页解析第67-69页
        5.2.5 存储第69-71页
    5.3 本章小结第71-73页
6 系统验证第73-81页
    6.1 系统业务功能验证第73-79页
    6.2 系统性能验证第79-80页
    6.3 本章小结第80-81页
7 结论第81-83页
    7.1 全文总结第81页
    7.2 不足与展望第81-83页
参考文献第83-85页
作者简历及攻读硕士专业学位期间取得的研究成果第85-87页
学位论文数据集第87页

论文共87页,点击 下载论文
上一篇:新浪微博营销模式研究
下一篇:大断面盾构过江隧道的静—动力分析