首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

互联网数据增量采集系统的设计与实现

摘要第4-5页
ABSTRACT第5-6页
目录第7-9页
第一章 绪论第9-13页
    1.1. 研究背景与意义第9页
    1.2. 国内外研究现状第9-10页
    1.3. 研究内容与本文工作第10-12页
    1.4. 论文内容与结构第12-13页
第二章 技术介绍与需求分析第13-21页
    2.1. 技术介绍第13-18页
        2.1.1. Heritrix第13-17页
        2.1.2. Spring第17-18页
    2.2. 需求分析第18-21页
        2.2.1. 增量采集功能第18页
        2.2.2. 多任务机制第18-19页
        2.2.3. 快速开发接口第19页
        2.2.4. 爬虫工具包第19-20页
        2.2.5. 数据存储第20-21页
第三章 增量采集系统的设计第21-40页
    3.1. 系统设计目标第21页
    3.2. 系统总体框架第21-22页
    3.3. 系统功能设计第22-40页
        3.3.1. 增量控制第23-26页
        3.3.2. 爬虫任务管理第26-28页
        3.3.3. 快速开发接口第28-32页
        3.3.4. 爬虫工具类第32-36页
        3.3.5. 增量策略第36-37页
        3.3.6. 数据存储第37-38页
        3.3.7. 增量统计第38-40页
第四章 增量采集系统的实现第40-58页
    4.1. 系统核心功能第40-50页
        4.1.1. 爬虫任务管理第41-43页
        4.1.2. 任务配置第43页
        4.1.3. 增量控制第43-45页
        4.1.4. 任务开发接口第45-46页
        4.1.5. 爬虫代理第46-47页
        4.1.6. 链接队列第47-48页
        4.1.7. js动态解析第48页
        4.1.8. 增量统计第48-49页
        4.1.9. 数据存储第49-50页
    4.2. 爬虫任务开发第50-58页
        4.2.1. 确定数据源第51页
        4.2.2. 接口实现第51-53页
        4.2.3. 任务开发过程第53-58页
第五章 系统应用与测试第58-66页
    5.1. 系统部署第58-59页
        5.1.1. 部署环境第58页
        5.1.2. 部署步骤第58-59页
    5.2. 系统测试第59-64页
        5.2.1. 功能测试第59-62页
        5.2.2. 性能测试第62-64页
    5.3. 测试总结第64-66页
第六章 总结与展望第66-68页
    6.1. 总结第66页
    6.2. 展望第66-68页
参考文献第68-70页
致谢第70-71页
攻读学位期间发表的学术论文目录第71页

论文共71页,点击 下载论文
上一篇:公司治理与股票价格同步性
下一篇:最终控制人性质、资产减值准备与企业非效率投资