基于Spark的微博数据分析系统的设计和实现
摘要 | 第5-6页 |
ABSTRACT | 第6-7页 |
第一章 绪论 | 第10-14页 |
1.1 研究背景与意义 | 第10-11页 |
1.2 主要工作内容 | 第11页 |
1.3 论文结构安排 | 第11-14页 |
第二章 相关技术综述 | 第14-26页 |
2.1 大数据分析关键技术介绍 | 第14-19页 |
2.1.1 分布式爬虫技术 | 第14-15页 |
2.1.2 数据收集技术 | 第15-16页 |
2.1.3 分布式存储技术 | 第16-18页 |
2.1.4 分布式计算技术 | 第18-19页 |
2.2 微博数据分析现状 | 第19-24页 |
2.2.1 微博数据特点 | 第20-21页 |
2.2.2 微博数据分析研究现状 | 第21-23页 |
2.2.3 微博数据分析应用现状 | 第23-24页 |
2.3 本章小结 | 第24-26页 |
第三章 基于Spark的微博数据分析系统的设计 | 第26-40页 |
3.1 系统总体设计 | 第26-28页 |
3.2 数据采集模块的设计 | 第28-30页 |
3.3 数据存储模块的设计 | 第30-31页 |
3.4 数据分析模块的设计 | 第31-38页 |
3.4.1 微博用户影响力分析的设计 | 第32-34页 |
3.4.2 微博话题挖掘的设计 | 第34-36页 |
3.4.3 微博文本情感分析的设计 | 第36-38页 |
3.5 数据可视化模块的设计 | 第38-39页 |
3.6 本章小结 | 第39-40页 |
第四章 基于Spark的微博数据分析系统的实现 | 第40-68页 |
4.1 系统环境搭建 | 第40-42页 |
4.1.1 软硬件环境 | 第40页 |
4.1.2 分布式集群部署 | 第40-42页 |
4.2 数据采集模块的实现 | 第42-47页 |
4.2.1 分布式爬虫的实现 | 第42-45页 |
4.2.2 数据收集的实现 | 第45-47页 |
4.3 数据存储模块的实现 | 第47-49页 |
4.4 数据分析模块的实现 | 第49-62页 |
4.4.1 数据预处理的实现 | 第49-50页 |
4.4.2 微博用户影响力分析的实现 | 第50-52页 |
4.4.3 微博话题挖掘的实现 | 第52-57页 |
4.4.4 微博文本情感分析的实现 | 第57-62页 |
4.5 数据可视化模块的实现 | 第62-66页 |
4.6 本章小结 | 第66-68页 |
第五章 总结和展望 | 第68-72页 |
5.1 论文工作总结 | 第68-69页 |
5.2 下一步工作计划 | 第69-72页 |
参考文献 | 第72-76页 |
缩略语 | 第76-78页 |
致谢 | 第78页 |