基于流计算的实时推荐系统的研究

摘要	第9-10页
Abstract	第10-11页
1 绪论	第12-18页
1.1 研究背景与意义	第12-13页
1.2 国内外研究现状	第13-16页
1.2.1 流计算研究现状	第13-14页
1.2.2 实时推荐算法研究现状	第14-15页
1.2.3 实时推荐系统的研究现状	第15-16页
1.3 本文主要研究内容	第16-17页
1.4 论文的组织结构	第17-18页
2 相关技术介绍	第18-30页
2.1 推荐系统	第18-22页
2.1.1 基本原理	第18页
2.1.2 推荐算法	第18-21页
2.1.3 评价指标	第21-22页
2.2 分布式流处理技术	第22-26页
2.2.1 日志收集系统Flume	第22-24页
2.2.2 消息缓冲系统Kafka	第24-25页
2.2.3 流计算系统Spark Streaming	第25-26页
2.3 分布式存储技术	第26-29页
2.3.1 内存数据库Redis	第26-27页
2.3.2 文件数据库MongoDB	第27-29页
2.4 本章小结	第29-30页
3 基于Item-CF的实时推荐算法	第30-39页
3.1 传统基于物品的推荐算法	第30-32页
3.1.1 用户-物品评分矩阵	第30-31页
3.1.2 计算物品相似度	第31-32页
3.1.3 评分预测	第32页
3.2 基于Item-CF算法存在的问题	第32-33页
3.3 改进的基于Item-CF的实时推荐算法	第33-38页
3.3.1 物品相似度计算	第34-35页
3.3.2 推荐优先级计算	第35-38页
3.4 本章小结	第38-39页
4 实时推荐系统的设计与实现	第39-50页
4.1 系统性能需求	第39-40页
4.1.1 低要求高效率	第39页
4.1.2 高容错高可靠性	第39页
4.1.3 扩展性	第39页
4.1.4 实时性	第39-40页
4.2 实时推荐系统的设计	第40-43页
4.2.1 系统架构设计	第40-41页
4.2.2 数据模型	第41-43页
4.3 实时推荐系统的实现	第43-48页
4.3.1 离线部分处理	第43-45页
4.3.2 在线部分处理	第45-48页
4.4 本章小结	第48-50页
5 系统测试和结果分析	第50-56页
5.1 实验环境	第50页
5.2 实验数据集	第50-51页
5.3 测试目的与方案设计	第51-52页
5.3.1 准确性测试	第51页
5.3.2 性能测试	第51-52页
5.4 测试结果分析	第52-55页
5.4.1 准确性分析	第52-53页
5.4.2 性能分析	第53-55页
5.5 本章小结	第55-56页
6 总结与展望	第56-58页
6.1 全文总结	第56页
6.2 未来展望	第56-58页
7 参考文献	第58-62页
8 攻读硕士学位期间发表的论文	第62-63页
致谢	第63页