首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

TrenData数据分析平台数据爬取与处理模块的设计与实现

摘要第5-6页
Abstract第6页
第一章 引言第12-19页
    1.1 项目背景第12页
    1.2 电商数据分析在国内外工业界的发展与应用概况第12-17页
        1.2.1 基于淘宝的数据魔方第14-16页
        1.2.2 超级数据第16-17页
        1.2.3 DataCaciques(数字酋长)第17页
    1.3 本文的主要工作第17-18页
    1.4 本文的组织结构第18-19页
第二章 技术综述第19-28页
    2.1 Scrapy第19-22页
    2.2 Scrapyd第22-23页
    2.3 MongoDB第23-25页
    2.4 自然语言处理第25-26页
        2.4.1 Python的NLTK库第25-26页
        2.4.2 朴素贝叶斯分类方法第26页
    2.5 本章小结第26-28页
第三章 TrenData数据分析平台的分析与设计第28-45页
    3.1 平台运行环境第28页
    3.2 平台总体规划第28-29页
    3.3 平台需求分析第29-31页
    3.4 平台总体设计与模块划分第31-32页
    3.5 数据爬取模块分析与设计第32-43页
        3.5.1 模块需求分析第32-33页
        3.5.2 模块整体设计第33-34页
        3.5.3 Slave主机爬取功能分析与设计第34-41页
        3.5.4 Master主机任务管理功能分析与设计第41-43页
    3.6 数据处理模块分析与设计第43-44页
        3.6.1 模块需求分析第43页
        3.6.2 模块详细设计第43-44页
    3.7 本章小结第44-45页
第四章 TrenData数据分析平台数据爬取与处理模块的实现第45-65页
    4.1 数据爬取模块的实现第45-57页
        4.1.1 Amazon电商相关数据爬取第46-56页
        4.1.2 Scrapyd部署第56-57页
    4.2 数据处理模块的实现第57-62页
        4.2.1 数据清洗整理第57-59页
        4.2.2 数据分析第59-62页
    4.3 TrenData数据分析平台展示第62-64页
    4.4 本章小结第64-65页
第五章 总结与展望第65-66页
    5.1 总结第65页
    5.2 进一步工作展望第65-66页
参考文献第66-68页
致谢第68-70页

论文共70页,点击 下载论文
上一篇:悬铃木开花生物学与生长规律研究
下一篇:基于正则化下延方法的视密度全空间反演