首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

娱乐消费大数据分析系统的研究与实现

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第12-15页
    1.1 研究背景与意义第12页
    1.2 国内外研究现状第12-13页
    1.3 论文主要工作与组织结构安排第13-15页
        1.3.1 主要工作第13-14页
        1.3.2 论文结构安排第14-15页
第二章 相关技术介绍第15-19页
    2.1 Hadoop第15页
    2.2 Spark大数据处理框架及其生态系统第15-17页
        2.2.1 Spark core第15-16页
        2.2.2 Spark Streaming第16页
        2.2.3 Spark SQL第16页
        2.2.4 MLlib第16-17页
        2.2.5 GraphX第17页
    2.3 scala语言第17页
    2.4 Zookeeper第17页
    2.5 Hive第17-18页
    2.6 MySQL第18页
    2.7 本章小结第18-19页
第三章 娱乐消费大数据分析系统的设计第19-32页
    3.1 系统需求分析第19页
    3.2 系统总体设计第19-21页
    3.3 获取数据算法第21-23页
        3.3.1 获取数据算法架构第21页
        3.3.2 获取数据算法运行流程第21-23页
    3.4 聚合统计模块设计第23-25页
    3.5 随机抽取模块设计第25页
    3.6 Top10热门品类模块设计第25-26页
    3.7 Top10活跃session模块设计第26-27页
    3.8 数据库设计第27-31页
        3.8.1 数据库总体设计第27页
        3.8.2 数据库表设计第27-31页
        3.8.3 数据处理过程第31页
    3.9 本章小结第31-32页
第四章 娱乐消费大数据分析系统的实现第32-40页
    4.1 Spark开发环境及其分布式集群搭建第32-35页
        4.1.1 硬件系统要求第32页
        4.1.2 构造分布式Hadoop集群第32-33页
        4.1.3 构造分布式Spark集群第33页
        4.1.4 安装Hive第33-34页
        4.1.5 安装MySQL第34页
        4.1.6 安装Zookeeper第34-35页
    4.2 获取数据算法的实现第35-36页
        4.2.1 调度器第35页
        4.2.2 URL管理器第35-36页
        4.2.3 网页下载器第36页
        4.2.4 网页解析器第36页
        4.2.5 网页输出器第36页
    4.3 聚合统计模块的实现第36-37页
    4.4 随机抽取模块的实现第37-38页
    4.5 Top10热门品类模块的实现第38-39页
    4.6 Top10活跃session模块的实现第39页
    4.7 本章小结第39-40页
第五章 系统测试第40-44页
    5.1 功能性测试第40-42页
        5.1.1 生成模拟数据第40-41页
        5.1.2 聚合统计模块测试第41页
        5.1.3 随机抽取模块测试第41页
        5.1.4 Top10热门品类模块测试第41-42页
        5.1.5 Top10活跃sesssion模块测试第42页
    5.2 非功能性测试第42-43页
    5.3 本章小结第43-44页
第六章 总结与展望第44-45页
参考文献第45-47页
致谢第47页

论文共47页,点击 下载论文
上一篇:基于安卓平台的行人检测
下一篇:CPN模型初始标记域生成工具的设计与实现