首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

学生公寓房源数据采集平台的设计与实现

致谢第5-6页
摘要第6-8页
ABSTRACT第8-9页
1 引言第13-19页
    1.1 项目开发背景第13-14页
    1.2 系统要解决的问题第14-15页
    1.3 国内外发展现状第15-16页
    1.4 本人工作总结第16-17页
    1.5 论文组织结构第17-19页
2 相关技术第19-31页
    2.1 网络爬虫概述第19页
    2.2 数据采集第19-21页
        2.2.1 网页信息定位第20页
        2.2.2 爬虫代理第20-21页
        2.2.3 动态网页抓取第21页
    2.3 Scrapy框架第21-23页
    2.4 Scrapinghub部署平台第23页
    2.5 JSON Schema第23-24页
    2.6 消息队列第24-27页
        2.6.1 AMQP协议第24-25页
        2.6.2 Celery框架第25-27页
    2.7 Django框架第27-28页
    2.8 Redis第28页
    2.9 REST架构第28-29页
        2.9.1 Django REST Framework第29页
    2.10 本章小结第29-31页
3 系统需求分析第31-41页
    3.1 系统概述第31页
    3.2 功能性需求分析第31-38页
        3.2.1 爬虫部署平台需求功能分析第32-35页
        3.2.2 数据应用后端需求功能分析第35-38页
    3.3 非功能性需求第38-39页
    3.4 本章小结第39-41页
4 系统概要设计第41-51页
    4.1 系统总体框架设计第41页
    4.2 Scrapy框架改进设计第41-46页
    4.3 Scrapy Cloud爬虫服务端设计第46-47页
        4.3.1 部署爬虫项目第47页
        4.3.2 启动爬虫任务第47页
        4.3.3 运行数据监控第47页
    4.4 Sharingan服务端设计第47-49页
    4.5 本章小结第49-51页
5 系统详细设计与实现第51-75页
    5.1 Fragment模块设计与实现第51-54页
        5.1.1 FragmentItem第51-53页
        5.1.2 FragmentSpider第53-54页
    5.2 Pipeline模块设计与实现第54-60页
        5.2.1 UrlAttachPipeline第55页
        5.2.2 ProcessorPipeline第55-58页
        5.2.3 AssemblePipeline第58-59页
        5.2.4 FieldMappingPipeline第59页
        5.2.5 JsonSchemaValidatePipeline第59-60页
    5.3 Scrapy Cloud服务端设计与实现第60-65页
        5.3.1 上传爬虫项目第61-62页
        5.3.2 Schedule Service启动爬虫第62-63页
        5.3.3 job_stats运行信息监控第63-65页
        5.3.4 Item与Log文件下载第65页
    5.4 Sharingan服务端设计与实现第65-72页
        5.4.1 数据获取第65-66页
        5.4.2 数据导入第66-68页
        5.4.3 消息导出第68-69页
        5.4.4 房源合并第69-71页
        5.4.5 房源的查看编辑第71-72页
    5.5 本章小结第72-75页
6 系统测试第75-83页
    6.1 单元测试第75-80页
        6.1.1 Fragment模块测试第75页
        6.1.2 Pipeline模块测试第75-80页
    6.2 集成测试第80-81页
        6.2.1 Schedule Service测试第80页
        6.2.2 数据导入和消息生成测试第80-81页
    6.3 系统测试第81页
    6.4 本章小结第81-83页
7 结论与展望第83-85页
    7.1 工作总结第83页
    7.2 工作展望第83-85页
参考文献第85-87页
作者简历及攻读硕士学位期间取得的研究成果第87-91页
学位论文数据集第91页

论文共91页,点击 下载论文
上一篇:基于数据挖掘的教务系统的研究与应用
下一篇:高速贴片机的结构拓扑优化与静、动态性能分析