基于Storm的微博实时推荐系统的设计与实现

摘要	第4-6页
ABSTRACT	第6-7页
第一章绪论	第10-15页
1.1 研究背景与意义	第10-11页
1.2 国内外研究现状	第11-13页
1.3 主要工作及创新点	第13-14页
1.4 论文结构	第14-15页
第二章系统相关技术概述	第15-26页
2.1 HADOOP简介	第15-18页
2.1.1 Hadoop生态系统简介	第15-16页
2.1.2 MapReduce简介	第16-17页
2.1.3 HDFS简介	第17-18页
2.2 STORM简介	第18-20页
2.2.1 Storm的核心概念	第19页
2.2.2 Storm中的流分组机制	第19-20页
2.2.3 Storm与Hadoop的比较	第20页
2.3 KAFKA分布式发布订阅消息系统	第20-21页
2.3.1 Kafka的基本术语和概念	第21页
2.3.2 一些常用消息队列的介绍	第21页
2.4 滑动窗口模型与TF-IDF算法	第21-23页
2.4.1 滑动窗口模型	第22-23页
2.4.2 TF-IDF算法	第23页
2.5 其他相关内容介绍	第23-25页
2.5.1 牛顿冷却定律	第23-24页
2.5.2 中文分词技术	第24-25页
2.6 本章小结	第25-26页
第三章微博实时推荐系统的概要设计	第26-36页
3.1 微博实时推荐系统需求分析	第26-28页
3.2 微博实时推荐系统的架构设计	第28-34页
3.2.1 数据采集子系统	第29-30页
3.2.2 数据离线处理子系统	第30-31页
3.2.3 数据实时处理子系统	第31-32页
3.2.4 数据存储子系统	第32-34页
3.2.5 数据展示子系统	第34页
3.3 本章小结	第34-36页
第四章微博实时推荐系统的详细设计与实现	第36-58页
4.1 数据采集子系统的实现	第36-37页
4.1.1 新浪微博API	第36-37页
4.1.2 网络爬虫的实现	第37页
4.2 数据储存子系统的实现	第37-40页
4.2.1 HBase中数据的存储结构	第38-39页
4.2.2 MySQL中数据的存储结构	第39-40页
4.3 数据离线处理子系统的实现	第40-42页
4.3.1 TF-FF算法	第40-41页
4.3.2 用户兴趣向量的计算	第41-42页
4.4 数据实时处理子系统的实现	第42-50页
4.4.1 热门关键词计算模块的实现	第42-46页
4.4.2 用户兴趣模型实时更新模块的实现	第46-48页
4.4.3 实时微博推荐模块的实现	第48-50页
4.5 数据展示子系统的实现	第50-57页
4.5.1 用户管理模块的实现	第51-53页
4.5.2 热门关键词推荐模块的实现	第53-55页
4.5.3 微博推荐模块的实现	第55-56页
4.5.4 用户日志采集模块的实现	第56-57页
4.6 本章小结	第57-58页
第五章测试与验证	第58-70页
5.1 系统的部署	第58-62页
5.1.1 测试环境介绍	第58-59页
5.1.2 软件环境的搭建与测试	第59-61页
5.1.3 系统服务的部署	第61-62页
5.2 系统测试与结果分析	第62-69页
5.2.1 微博数据抓取的验证	第62-63页
5.2.2 关键词提取的验证	第63页
5.2.3 热门关键词推荐的验证	第63-65页
5.2.4 用户兴趣向量算法的比较	第65-67页
5.2.5 实时微博推荐的验证	第67-69页
5.3 本章小结	第69-70页
第六章结束语	第70-72页
6.1 论文工作总结	第70-71页
6.2 问题与展望	第71-72页
参考文献	第72-74页
致谢	第74页