首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

基于Spark的移动平台广告数据分析系统设计与实现

摘要第5-6页
Abstract第6页
第一章 绪论第10-15页
    1.1 研究背景及意义第10-11页
    1.2 国内外研究现状第11-14页
        1.2.1 Spark分布式平台现状第11-12页
        1.2.2 移动推荐算法现状第12-14页
    1.3 本文的工作及组织结构第14-15页
第二章 相关理论和技术第15-22页
    2.1 大数据相关技术第15-20页
        2.1.1 Flume日志收集第15页
        2.1.2 Kafka消息队列第15-16页
        2.1.3 Druid.io实时查询第16-17页
        2.1.4 HDFS分布式存储第17-18页
        2.1.5 Spark计算平台第18-20页
    2.2 部分推荐算法简介第20-21页
        2.2.1 基于内容的推荐第20页
        2.2.2 协同过滤推荐第20-21页
        2.2.3 混合推荐第21页
    2.3 本章小结第21-22页
第三章 系统总体架构设计第22-28页
    3.1 系统总体设计第22-23页
    3.2 系统子模块介绍第23-27页
        3.2.1 数据采集与预处理第23-25页
        3.2.2 实时查询模块第25-26页
        3.2.3 离线处理模块第26-27页
    3.3 本章小节第27-28页
第四章 数据采集和预处理模块第28-38页
    4.1 数据采集和预处理模块设计思路第28-29页
    4.2 Flume数据采集实现第29-31页
        4.2.1 Flume组件第29页
        4.2.2 Flume部署第29-31页
    4.3 Kafka数据缓存与预处理第31-34页
        4.3.1 Kafka关键概念和分区原理第32-33页
        4.3.2 Kafka分布式部署第33-34页
    4.4 Flume-Kafka处理线实现第34-37页
        4.4.1 类设计及部分具体实现第34-36页
        4.4.2 Flume-Kafka测试第36-37页
    4.5 本章小结第37-38页
第五章 在线查询模块设计与实现第38-46页
    5.1 节点类型及其原理介绍第38-39页
    5.2 Druid在线查询系统分布式设计与实现第39-41页
    5.3 Flume-Kafka-Druid处理线实现第41-45页
        5.3.1 Kafka-Druid设计思路第41页
        5.3.2 Kafka数据预处理第41-43页
        5.3.3 Flume-Kafka-Druid测试第43-45页
    5.4 本章小结第45-46页
第六章 离线推荐模块设计与实现第46-54页
    6.1 Spark作业运行流程第46-47页
    6.2 程序相关算法理论第47-48页
        6.2.1 基于模型的协同过滤算法第47-48页
        6.2.2 衡量指标第48页
    6.3 基于Spark的移动广告推荐算法实现第48-53页
        6.3.1 移动广告数据处理第48-51页
        6.3.2 基于Spark MLlib的推荐算法实现第51-53页
    6.4 本章小结第53-54页
第七章 实验与分析第54-66页
    7.1 环境搭建第54-57页
        7.1.1 物理机和虚拟环境配置第54页
        7.1.2 软件环境配置和节点分布第54-57页
    7.2 功能测试第57-63页
        7.2.1 Druid.io实时系统功能测试第57-61页
        7.2.2 Spark离线模块功能测试第61-63页
    7.3 性能测试第63-65页
    7.4 本章小结第65-66页
总结与展望第66-68页
参考文献第68-71页
攻读硕士学位期间取得的研究成果第71-72页
致谢第72-73页
附件第73页

论文共73页,点击 下载论文
上一篇:基于数据挖掘的农村信用社客户管理系统
下一篇:空间小型二维云台成像系统结构设计