首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

基于Actor模型的广域分布式爬虫的设计与实现

摘要第4-6页
ABSTRACT第6-7页
第一章 绪论第11-17页
    1.1 课题背景第11-13页
        1.1.1 网络爬虫背景第11-12页
        1.1.2 分布式系统背景第12-13页
    1.2 爬虫的工作原理第13-14页
    1.3 课题研究内容与意义第14-16页
    1.4 本文结构安排第16页
    1.5 本章小结第16-17页
第二章 框架的需求分析第17-22页
    2.1 爬虫需求第17-19页
        2.1.1 作业提交第18页
        2.1.2 作业管理第18页
        2.1.3 作业调度第18-19页
        2.1.4 作业存储第19页
        2.1.5 URL去重第19页
        2.1.6 页面解析第19页
    2.2 分布式需求第19-20页
        2.2.1 系统可扩展性第19-20页
        2.2.2 系统可靠性第20页
        2.2.3 系统可用性第20页
    2.3 性能需求第20-21页
    2.4 其它需求第21页
    2.5 本章小结第21-22页
第三章 系统总体设计第22-28页
    3.1 总体框架第22页
    3.2 模块划分第22-27页
        3.2.1 Master模块第23-25页
        3.2.2 Slave模块第25-26页
        3.2.3 Worker模块第26页
        3.2.4 Client模块第26-27页
        3.2.5 后端存储模块第27页
    3.3 本章小结第27-28页
第四章 系统详细设计与实现第28-61页
    4.1 Master模块第28-45页
        4.1.1 相关技术第28-33页
        4.1.2 Master模块结构设计与功能解析第33-34页
        4.1.3 HTTP服务模块第34-35页
        4.1.4 心跳处理模块第35页
        4.1.5 节点管理模块第35-38页
        4.1.6 作业控制模块第38-43页
        4.1.7 重启服务模块第43-44页
        4.1.8 高可用服务模块第44-45页
    4.2 Slave模块第45-53页
        4.2.1 Slave模块结构设计与功能解析第45-46页
        4.2.2 HTTP服务模块第46-47页
        4.2.3 心跳服务模块第47-49页
        4.2.4 任务服务模块第49页
        4.2.5 代理服务模块第49-52页
        4.2.6 Worker管理模块第52-53页
        4.2.7 重启服务模块第53页
    4.3 Worker模块第53-57页
        4.3.1 网页抓取模块第55-56页
        4.3.2 网页解析模块第56页
        4.3.3 心跳模块第56页
        4.3.4 清理服务模块第56-57页
    4.4 后端存储模块第57-59页
        4.4.1 相关技术第57-58页
        4.4.2 HTTP服务模块第58页
        4.4.3 数据写入模块第58-59页
    4.5 Client模块第59-60页
    4.6 本章总结第60-61页
第五章 系统部署与测试第61-67页
    5.1 系统部署第61页
        5.1.1 硬件环境第61页
        5.1.2 软件环境第61页
    5.2 系统功能测试第61-63页
    5.3 系统性能测试第63-66页
    5.4 测试总结第66-67页
第六章 总结与展望第67-69页
    6.1 论文工作总结第67页
    6.2 下一步工作计划第67-69页
参考文献第69-70页
致谢第70页

论文共70页,点击 下载论文
上一篇:数字化高校收费管理系统的设计与实现
下一篇:基于SIFT的双目图像深度信息提取