基于Spark的微博数据分析系统的设计和实现
| 摘要 | 第5-6页 |
| ABSTRACT | 第6-7页 |
| 第一章 绪论 | 第10-14页 |
| 1.1 研究背景与意义 | 第10-11页 |
| 1.2 主要工作内容 | 第11页 |
| 1.3 论文结构安排 | 第11-14页 |
| 第二章 相关技术综述 | 第14-26页 |
| 2.1 大数据分析关键技术介绍 | 第14-19页 |
| 2.1.1 分布式爬虫技术 | 第14-15页 |
| 2.1.2 数据收集技术 | 第15-16页 |
| 2.1.3 分布式存储技术 | 第16-18页 |
| 2.1.4 分布式计算技术 | 第18-19页 |
| 2.2 微博数据分析现状 | 第19-24页 |
| 2.2.1 微博数据特点 | 第20-21页 |
| 2.2.2 微博数据分析研究现状 | 第21-23页 |
| 2.2.3 微博数据分析应用现状 | 第23-24页 |
| 2.3 本章小结 | 第24-26页 |
| 第三章 基于Spark的微博数据分析系统的设计 | 第26-40页 |
| 3.1 系统总体设计 | 第26-28页 |
| 3.2 数据采集模块的设计 | 第28-30页 |
| 3.3 数据存储模块的设计 | 第30-31页 |
| 3.4 数据分析模块的设计 | 第31-38页 |
| 3.4.1 微博用户影响力分析的设计 | 第32-34页 |
| 3.4.2 微博话题挖掘的设计 | 第34-36页 |
| 3.4.3 微博文本情感分析的设计 | 第36-38页 |
| 3.5 数据可视化模块的设计 | 第38-39页 |
| 3.6 本章小结 | 第39-40页 |
| 第四章 基于Spark的微博数据分析系统的实现 | 第40-68页 |
| 4.1 系统环境搭建 | 第40-42页 |
| 4.1.1 软硬件环境 | 第40页 |
| 4.1.2 分布式集群部署 | 第40-42页 |
| 4.2 数据采集模块的实现 | 第42-47页 |
| 4.2.1 分布式爬虫的实现 | 第42-45页 |
| 4.2.2 数据收集的实现 | 第45-47页 |
| 4.3 数据存储模块的实现 | 第47-49页 |
| 4.4 数据分析模块的实现 | 第49-62页 |
| 4.4.1 数据预处理的实现 | 第49-50页 |
| 4.4.2 微博用户影响力分析的实现 | 第50-52页 |
| 4.4.3 微博话题挖掘的实现 | 第52-57页 |
| 4.4.4 微博文本情感分析的实现 | 第57-62页 |
| 4.5 数据可视化模块的实现 | 第62-66页 |
| 4.6 本章小结 | 第66-68页 |
| 第五章 总结和展望 | 第68-72页 |
| 5.1 论文工作总结 | 第68-69页 |
| 5.2 下一步工作计划 | 第69-72页 |
| 参考文献 | 第72-76页 |
| 缩略语 | 第76-78页 |
| 致谢 | 第78页 |