基于Spark的移动平台广告数据分析系统设计与实现

摘要	第5-6页
Abstract	第6页
第一章绪论	第10-15页
1.1 研究背景及意义	第10-11页
1.2 国内外研究现状	第11-14页
1.2.1 Spark分布式平台现状	第11-12页
1.2.2 移动推荐算法现状	第12-14页
1.3 本文的工作及组织结构	第14-15页
第二章相关理论和技术	第15-22页
2.1 大数据相关技术	第15-20页
2.1.1 Flume日志收集	第15页
2.1.2 Kafka消息队列	第15-16页
2.1.3 Druid.io实时查询	第16-17页
2.1.4 HDFS分布式存储	第17-18页
2.1.5 Spark计算平台	第18-20页
2.2 部分推荐算法简介	第20-21页
2.2.1 基于内容的推荐	第20页
2.2.2 协同过滤推荐	第20-21页
2.2.3 混合推荐	第21页
2.3 本章小结	第21-22页
第三章系统总体架构设计	第22-28页
3.1 系统总体设计	第22-23页
3.2 系统子模块介绍	第23-27页
3.2.1 数据采集与预处理	第23-25页
3.2.2 实时查询模块	第25-26页
3.2.3 离线处理模块	第26-27页
3.3 本章小节	第27-28页
第四章数据采集和预处理模块	第28-38页
4.1 数据采集和预处理模块设计思路	第28-29页
4.2 Flume数据采集实现	第29-31页
4.2.1 Flume组件	第29页
4.2.2 Flume部署	第29-31页
4.3 Kafka数据缓存与预处理	第31-34页
4.3.1 Kafka关键概念和分区原理	第32-33页
4.3.2 Kafka分布式部署	第33-34页
4.4 Flume-Kafka处理线实现	第34-37页
4.4.1 类设计及部分具体实现	第34-36页
4.4.2 Flume-Kafka测试	第36-37页
4.5 本章小结	第37-38页
第五章在线查询模块设计与实现	第38-46页
5.1 节点类型及其原理介绍	第38-39页
5.2 Druid在线查询系统分布式设计与实现	第39-41页
5.3 Flume-Kafka-Druid处理线实现	第41-45页
5.3.1 Kafka-Druid设计思路	第41页
5.3.2 Kafka数据预处理	第41-43页
5.3.3 Flume-Kafka-Druid测试	第43-45页
5.4 本章小结	第45-46页
第六章离线推荐模块设计与实现	第46-54页
6.1 Spark作业运行流程	第46-47页
6.2 程序相关算法理论	第47-48页
6.2.1 基于模型的协同过滤算法	第47-48页
6.2.2 衡量指标	第48页
6.3 基于Spark的移动广告推荐算法实现	第48-53页
6.3.1 移动广告数据处理	第48-51页
6.3.2 基于Spark MLlib的推荐算法实现	第51-53页
6.4 本章小结	第53-54页
第七章实验与分析	第54-66页
7.1 环境搭建	第54-57页
7.1.1 物理机和虚拟环境配置	第54页
7.1.2 软件环境配置和节点分布	第54-57页
7.2 功能测试	第57-63页
7.2.1 Druid.io实时系统功能测试	第57-61页
7.2.2 Spark离线模块功能测试	第61-63页
7.3 性能测试	第63-65页
7.4 本章小结	第65-66页
总结与展望	第66-68页
参考文献	第68-71页
攻读硕士学位期间取得的研究成果	第71-72页
致谢	第72-73页
附件	第73页