基于Spark的社交网络数据分析平台
| 摘要 | 第8-9页 |
| ABSTRACT | 第9-10页 |
| 第1章 绪论 | 第11-15页 |
| 1.1 开发背景及意义 | 第11-12页 |
| 1.2 国内外研究现状 | 第12-13页 |
| 1.3 开发的目标 | 第13-14页 |
| 1.4 本论文的组织与结构 | 第14-15页 |
| 第2章 数据分析平台概述 | 第15-19页 |
| 2.1 需求描述 | 第15-16页 |
| 2.2 相关技术简介 | 第16-17页 |
| 2.3 架构设计 | 第17-19页 |
| 第3章 数据获取的实现 | 第19-45页 |
| 3.1 数据爬取的实现 | 第19-43页 |
| 3.1.1 自动登陆的实现 | 第19-22页 |
| 3.1.2 粉丝关系分布式爬取 | 第22-34页 |
| 3.1.3 ID顺序分布式爬取 | 第34-42页 |
| 3.1.4 总结 | 第42-43页 |
| 3.2 聊天数据获取的实现 | 第43-45页 |
| 第4章 数据计算与算法的实现 | 第45-58页 |
| 4.1 好友关系的计算 | 第46-47页 |
| 4.2 社区发现算法 | 第47-51页 |
| 4.3 中心性计算 | 第51-53页 |
| 4.4 文本分类模型 | 第53-55页 |
| 4.4.1 分类 | 第53-55页 |
| 4.4.2 结果 | 第55页 |
| 4.5 用户定位算法 | 第55-58页 |
| 第5章 Web平台的实现 | 第58-68页 |
| 5.1 用户管理功能 | 第59-61页 |
| 5.2 数据爬取功能 | 第61-62页 |
| 5.3 数据集管理功能 | 第62-64页 |
| 5.4 数据计算功能 | 第64-66页 |
| 5.5 数据可视化功能 | 第66-68页 |
| 5.5.1 轨迹数据的可视化 | 第66-68页 |
| 第6章 结论 | 第68-70页 |
| 6.1 工作总结 | 第68-69页 |
| 6.2 工作不足 | 第69-70页 |
| 参考文献 | 第70-72页 |
| 致谢 | 第72-73页 |
| 学位论文评阅及答辩情况表 | 第73页 |