TrenData数据分析平台数据爬取与处理模块的设计与实现

摘要	第5-6页
Abstract	第6页
第一章引言	第12-19页
1.1 项目背景	第12页
1.2 电商数据分析在国内外工业界的发展与应用概况	第12-17页
1.2.1 基于淘宝的数据魔方	第14-16页
1.2.2 超级数据	第16-17页
1.2.3 DataCaciques(数字酋长)	第17页
1.3 本文的主要工作	第17-18页
1.4 本文的组织结构	第18-19页
第二章技术综述	第19-28页
2.1 Scrapy	第19-22页
2.2 Scrapyd	第22-23页
2.3 MongoDB	第23-25页
2.4 自然语言处理	第25-26页
2.4.1 Python的NLTK库	第25-26页
2.4.2 朴素贝叶斯分类方法	第26页
2.5 本章小结	第26-28页
第三章 TrenData数据分析平台的分析与设计	第28-45页
3.1 平台运行环境	第28页
3.2 平台总体规划	第28-29页
3.3 平台需求分析	第29-31页
3.4 平台总体设计与模块划分	第31-32页
3.5 数据爬取模块分析与设计	第32-43页
3.5.1 模块需求分析	第32-33页
3.5.2 模块整体设计	第33-34页
3.5.3 Slave主机爬取功能分析与设计	第34-41页
3.5.4 Master主机任务管理功能分析与设计	第41-43页
3.6 数据处理模块分析与设计	第43-44页
3.6.1 模块需求分析	第43页
3.6.2 模块详细设计	第43-44页
3.7 本章小结	第44-45页
第四章 TrenData数据分析平台数据爬取与处理模块的实现	第45-65页
4.1 数据爬取模块的实现	第45-57页
4.1.1 Amazon电商相关数据爬取	第46-56页
4.1.2 Scrapyd部署	第56-57页
4.2 数据处理模块的实现	第57-62页
4.2.1 数据清洗整理	第57-59页
4.2.2 数据分析	第59-62页
4.3 TrenData数据分析平台展示	第62-64页
4.4 本章小结	第64-65页
第五章总结与展望	第65-66页
5.1 总结	第65页
5.2 进一步工作展望	第65-66页
参考文献	第66-68页
致谢	第68-70页