大规模网络事件热度预测系统的设计与实现

摘要	第4-5页
Abstract	第5页
第1章绪论	第9-14页
1.1 课题的来源及研究的背景和意义	第9-10页
1.1.1 课题的来源	第9页
1.1.2 课题研究的背景和意义	第9-10页
1.2 国内外在该方向的研究现状及分析	第10-12页
1.2.1 国外研究现状	第10-11页
1.2.2 国内研究现状	第11-12页
1.2.3 国内外文献综述简析	第12页
1.3 主要研究内容	第12-13页
1.4 本文组织结构	第13-14页
第2章相关技术研究	第14-21页
2.1 引言	第14页
2.2 Hbase数据库	第14-15页
2.3 Spark Streaming流式计算	第15-16页
2.4 Java Web框架	第16-19页
2.4.1 Spring	第17-18页
2.4.2 Struts2	第18-19页
2.4.3 Hibernate	第19页
2.5 网络爬虫	第19-20页
2.6 本章小结	第20-21页
第3章网络事件热度预测系统的总体设计	第21-27页
3.1 引言	第21-22页
3.2 系统的整体架构设计	第22-23页
3.3 系统关键执行流程	第23-26页
3.3.1 定时任务执行流程	第23-25页
3.3.2 新增用户执行流程	第25-26页
3.4 本章小结	第26-27页
第4章网络爬虫及预测建模的设计与实现	第27-41页
4.1 引言	第27页
4.2 新浪微博爬虫的设计与实现	第27-36页
4.2.1 难点分析	第27页
4.2.2 反爬机制的应对方法设计	第27-29页
4.2.3 分布式部署均衡任务并对URL去重	第29-30页
4.2.4 爬虫抓取新数据	第30-31页
4.2.5 数据存储	第31-36页
4.3 Twitter爬虫的设计与实现	第36-37页
4.3.1 简介	第36页
4.3.2 实时数据获取流程	第36-37页
4.3.3 历史数据获取	第37页
4.4 Spark建模及预测	第37-40页
4.5 本章小结	第40-41页
第5章交互网站的设计与实现	第41-57页
5.1 引言	第41页
5.2 需求分析	第41-45页
5.2.1 功能需求描述	第41-43页
5.2.2 功能模块划分	第43-44页
5.2.3 非功能需求	第44-45页
5.3 网站架构图	第45页
5.4 网站工作原理说明	第45-46页
5.5 类的设计	第46-47页
5.6 网站界面展示	第47-56页
5.7 本章小结	第56-57页
第6章系统测试与性能分析	第57-63页
6.1 引言	第57页
6.2 爬虫测试	第57-58页
6.3 用户特征提取模块测试	第58-59页
6.4 用户影响力模块测试	第59-60页
6.5 文本分类模块测试	第60-61页
6.6 Spark建模及预测模块测试	第61-62页
6.7 本章小结	第62-63页
结论	第63-64页
参考文献	第64-68页
攻读硕士学位期间发表的论文及其他成果	第68-70页
致谢	第70页