首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Scrapy的分布式网络爬虫系统设计与实现

摘要第5-6页
abstract第6-7页
第一章 绪论第10-14页
    1.1 研究背景及意义第10页
    1.2 国内外研究现状第10-12页
    1.3 主要研究工作第12-13页
    1.4 论文组织结构第13-14页
第二章 相关理论与技术基础第14-28页
    2.1 网络爬虫第14-17页
        2.1.1 网络爬虫的分类第14-15页
        2.1.2 网络爬虫的爬行策略第15-17页
    2.2 分布式网络爬虫第17-20页
        2.2.1 分布式爬虫系统架构第17-19页
        2.2.2 任务调度策略第19-20页
    2.3 SCRAPY框架研究第20-22页
        2.3.1 Scrapy框架结构第21-22页
        2.3.2 Scrapy框架的不足第22页
    2.4 相关技术第22-27页
        2.4.1 Redis数据库第22-24页
        2.4.2 Kafka消息系统第24-26页
        2.4.3 ZooKeeper第26-27页
    2.5 本章小结第27-28页
第三章 分布式网络爬虫系统设计第28-37页
    3.1 系统设计目标第28页
    3.2 系统总体设计第28-34页
        3.2.1 系统总体结构第28-32页
        3.2.2 系统运行机制第32-34页
    3.3 数据库设计第34-36页
        3.3.1 Redis集群第34-35页
        3.3.2 MongoDB集群第35-36页
    3.4 本章小结第36-37页
第四章 系统详细设计与实现第37-79页
    4.1 消息处理第37-46页
        4.1.1 状态计数器第37-39页
        4.1.2 消息预处理模块第39-42页
        4.1.3 Redis监控模块第42-46页
    4.2 主节点设计实现第46-56页
        4.2.1 任务调度器第46-49页
        4.2.2 限速器第49-53页
        4.2.3 过滤器第53-56页
    4.3 从节点群设计实现第56-78页
        4.3.1 Scrapy爬虫第56-73页
        4.3.2 爬虫管理第73-78页
    4.4 本章小结第78-79页
第五章 系统测试与展示第79-88页
    5.1 系统运行环境第79-80页
    5.2 模块性能测试第80-84页
        5.2.1 任务调度器模块测试第80-81页
        5.2.2 过滤器模块测试第81-83页
        5.2.3 爬虫采集速度测试第83-84页
    5.3 系统展示第84-87页
    5.4 本章小结第87-88页
第六章 总结与展望第88-90页
    6.1 总结第88页
    6.2 后续工作展望第88-90页
致谢第90-91页
参考文献第91-94页
攻读硕士学位期间取得的成果第94页

论文共94页,点击 下载论文
上一篇:基于视频信息的情绪感知系统的研究与实现
下一篇:IP-ZigBee网关设计及关节活动度测量网络中的应用