首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

支持动态网页解析的分布式网络爬虫系统的设计与实现

摘要第5-6页
Abstract第6-7页
专业术语解释第8-11页
第一章 绪论第11-18页
    1.1 研究背景第11-13页
    1.2 研究现状第13-15页
    1.3 研究目标及内容第15-16页
    1.4 论文组织结构第16-18页
第二章 相关理论与技术介绍第18-23页
    2.1 网络爬虫介绍第18-20页
        2.1.1 单机网络爬虫第18-19页
        2.1.2 分布式网络爬虫第19-20页
    2.2 相关开源软件介绍第20-22页
        2.2.1 Scrapy-redis第20-22页
        2.2.2 Redis第22页
        2.2.3 Selenium第22页
        2.2.4 Phantomjs第22页
    2.3 本章小结第22-23页
第三章 系统分析与设计第23-29页
    3.1 系统设计需求第23页
    3.2 系统框架和模块设计第23-28页
        3.2.1 初始化参数模块第24-25页
        3.2.2 任务分配模块和爬取策略模块第25页
        3.2.3 维护系统健壮性模块第25-26页
        3.2.4 数据爬取模块第26-27页
        3.2.5 异常处理模块和数据解析模块第27-28页
        3.2.6 数据存储模块第28页
    3.3 本章小结第28-29页
第四章 系统具体实现第29-44页
    4.1 系统功能模块实现第29-43页
        4.1.1 初始化参数模块第31-32页
        4.1.2 维护系统健壮性模块第32-37页
        4.1.3 数据爬取模块第37-41页
        4.1.4 异常处理模块和数据解析模块第41-42页
        4.1.5 数据存储模块第42-43页
    4.2 本章小结第43-44页
第五章 实验与分析第44-52页
    5.1 实验环境第44-46页
        5.1.1 实验的软硬件环境第44-45页
        5.1.2 分布式环境的搭建第45-46页
    5.2 爬虫健壮性实验分析第46-47页
        5.2.1 爬虫健壮性测试方案第46页
        5.2.2 实验数据第46-47页
        5.2.3 实验数据分析第47页
    5.3 动态网页解析策略实验分析第47-49页
        5.3.1 动态网页解析策略测试方案第47-48页
        5.3.2 实验数据第48页
        5.3.3 实验数据分析第48-49页
    5.4 分布式爬虫性能实验分析第49-51页
        5.4.1 分布式爬虫性能测试方案第49页
        5.4.2 实验数据第49-50页
        5.4.3 实验数据分析第50-51页
    5.5 本章小结第51-52页
第六章 总结与展望第52-54页
    6.1 论文总结第52页
    6.2 研究展望第52-54页
致谢第54-55页
参考文献第55-57页

论文共57页,点击 下载论文
上一篇:基于图像识别的多指针仪表自动读数方法研究与实现
下一篇:基于Spark的个性化电影推荐系统的设计与实现