首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Storm的微博实时推荐系统的设计与实现

摘要第4-6页
ABSTRACT第6-7页
第一章 绪论第10-15页
    1.1 研究背景与意义第10-11页
    1.2 国内外研究现状第11-13页
    1.3 主要工作及创新点第13-14页
    1.4 论文结构第14-15页
第二章 系统相关技术概述第15-26页
    2.1 HADOOP简介第15-18页
        2.1.1 Hadoop生态系统简介第15-16页
        2.1.2 MapReduce简介第16-17页
        2.1.3 HDFS简介第17-18页
    2.2 STORM简介第18-20页
        2.2.1 Storm的核心概念第19页
        2.2.2 Storm中的流分组机制第19-20页
        2.2.3 Storm与Hadoop的比较第20页
    2.3 KAFKA分布式发布订阅消息系统第20-21页
        2.3.1 Kafka的基本术语和概念第21页
        2.3.2 一些常用消息队列的介绍第21页
    2.4 滑动窗口模型与TF-IDF算法第21-23页
        2.4.1 滑动窗口模型第22-23页
        2.4.2 TF-IDF算法第23页
    2.5 其他相关内容介绍第23-25页
        2.5.1 牛顿冷却定律第23-24页
        2.5.2 中文分词技术第24-25页
    2.6 本章小结第25-26页
第三章 微博实时推荐系统的概要设计第26-36页
    3.1 微博实时推荐系统需求分析第26-28页
    3.2 微博实时推荐系统的架构设计第28-34页
        3.2.1 数据采集子系统第29-30页
        3.2.2 数据离线处理子系统第30-31页
        3.2.3 数据实时处理子系统第31-32页
        3.2.4 数据存储子系统第32-34页
        3.2.5 数据展示子系统第34页
    3.3 本章小结第34-36页
第四章 微博实时推荐系统的详细设计与实现第36-58页
    4.1 数据采集子系统的实现第36-37页
        4.1.1 新浪微博API第36-37页
        4.1.2 网络爬虫的实现第37页
    4.2 数据储存子系统的实现第37-40页
        4.2.1 HBase中数据的存储结构第38-39页
        4.2.2 MySQL中数据的存储结构第39-40页
    4.3 数据离线处理子系统的实现第40-42页
        4.3.1 TF-FF算法第40-41页
        4.3.2 用户兴趣向量的计算第41-42页
    4.4 数据实时处理子系统的实现第42-50页
        4.4.1 热门关键词计算模块的实现第42-46页
        4.4.2 用户兴趣模型实时更新模块的实现第46-48页
        4.4.3 实时微博推荐模块的实现第48-50页
    4.5 数据展示子系统的实现第50-57页
        4.5.1 用户管理模块的实现第51-53页
        4.5.2 热门关键词推荐模块的实现第53-55页
        4.5.3 微博推荐模块的实现第55-56页
        4.5.4 用户日志采集模块的实现第56-57页
    4.6 本章小结第57-58页
第五章 测试与验证第58-70页
    5.1 系统的部署第58-62页
        5.1.1 测试环境介绍第58-59页
        5.1.2 软件环境的搭建与测试第59-61页
        5.1.3 系统服务的部署第61-62页
    5.2 系统测试与结果分析第62-69页
        5.2.1 微博数据抓取的验证第62-63页
        5.2.2 关键词提取的验证第63页
        5.2.3 热门关键词推荐的验证第63-65页
        5.2.4 用户兴趣向量算法的比较第65-67页
        5.2.5 实时微博推荐的验证第67-69页
    5.3 本章小结第69-70页
第六章 结束语第70-72页
    6.1 论文工作总结第70-71页
    6.2 问题与展望第71-72页
参考文献第72-74页
致谢第74页

论文共74页,点击 下载论文
上一篇:针对微博舆情的采集与分析系统的设计与实现
下一篇:基于Hadoop的个性化推荐算法的研究与实现