首页--经济论文--贸易经济论文--中国国内贸易经济论文--商品流通论文--电子贸易、网上贸易论文

基于业务插件化的电商大数据采集系统

摘要第5-6页
abstract第6-7页
第1章 绪论第10-15页
    1.1 论文研究背景及意义第10页
    1.2 国内外发展现状第10-13页
    1.3 课题研究的主要内容以及组织架构第13-15页
第2章 数据采集相关技术第15-25页
    2.1 网络爬虫简介第15-19页
        2.1.1 网络爬虫原理第15-16页
        2.1.2 网络爬虫分类第16-17页
        2.1.3 网络爬虫搜索策略第17-19页
    2.2 URL去重第19-20页
    2.3 正则表达式第20-21页
    2.4 反爬虫应对第21-22页
    2.5 MVC框架第22-23页
    2.6 DRDS分表分库技术第23-24页
    2.7 本章小结第24-25页
第3章 电商大数据采集系统的需求分析和设计第25-40页
    3.1 系统功能简述第25页
    3.2 系统功能需求分析第25-28页
        3.2.1 任务调度第25页
        3.2.2 爬行器第25-26页
        3.2.3 解析器第26页
        3.2.4 业务插件化第26-28页
    3.3 系统的非功能性需求分析第28页
        3.3.1 性能要求第28页
        3.3.2 安全性要求第28页
        3.3.3 可扩展性要求第28页
    3.4 系统的整体设计思路第28-30页
        3.4.1 设计思路第28-29页
        3.4.2 系统的体系架构第29-30页
        3.4.3 系统的功能模块第30页
    3.5 系统功能模块设计第30-35页
        3.5.1 任务调度模块的设计第30-32页
        3.5.2 爬行器模块的设计第32-33页
        3.5.3 解析器模块的设计第33页
        3.5.4 业务插件化模块的设计第33-35页
    3.6 数据处理第35-39页
        3.6.1 数据库设计第35-37页
        3.6.2 店铺分类第37-39页
    3.7 本章小结第39-40页
第4章 电商大数据采集系统的实现第40-52页
    4.1 系统配置第40-41页
        4.1.1 开发环境配置第40页
        4.1.2 数据库配置第40-41页
    4.2 任务调度模块的实现第41-43页
        4.2.1 任务生成第41-42页
        4.2.2 任务分配第42-43页
    4.3 业务插件化模块的实现第43-45页
        4.3.1 任务认领第43-44页
        4.3.2 业务插件化的实现第44-45页
    4.4 爬行器模块的实现第45-49页
        4.4.1 HTTP协议分析第45-46页
        4.4.2 种子网站的管理第46-47页
        4.4.3 爬行器的实现第47-49页
    4.5 解析器模块的实现第49-51页
        4.5.1 页面分类第49-50页
        4.5.2 页面解析器的实现第50-51页
    4.6 本章小结第51-52页
第5章 系统测试第52-58页
    5.1 测试环境配置第52-53页
    5.2 系统运行状态第53-54页
    5.3 系统测试第54-56页
        5.3.1 单元测试第54-55页
        5.3.2 性能测试第55-56页
    5.4 采集结果第56-57页
    5.5 本章小结第57-58页
第6章 结论与展望第58-60页
    6.1 结论第58页
    6.2 展望第58-60页
参考文献第60-63页
致谢第63-64页
攻读学位期间参加的科研项目和成果第64页

论文共64页,点击 下载论文
上一篇:俄罗斯媒体中的中国游客形象呈现研究--以《消息报》《生意人报》和俄罗斯卫星社为例
下一篇:我国软件和信息技术行业上市公司收益质量评价研究