摘要 | 第5-6页 |
ABSTRACT | 第6-7页 |
第一章 绪论 | 第10-14页 |
1.1 研究背景 | 第10-11页 |
1.2 研究内容和意义 | 第11-12页 |
1.3 论文组织结构 | 第12-14页 |
第二章 相关理论基础 | 第14-26页 |
2.1 Spark简介 | 第14-17页 |
2.1.1 Spark和Hadoop | 第14页 |
2.1.2 Spark的体系架构 | 第14-15页 |
2.1.3 弹性分布式数据集RDD | 第15-16页 |
2.1.4 Spark任务执行流程 | 第16-17页 |
2.2 SparkGraphx组件及算法 | 第17-20页 |
2.2.1 Graphx计算框架 | 第17-19页 |
2.2.2 ConnectedComponents算法的原理和应用 | 第19-20页 |
2.3 Hive数据仓库原理 | 第20-22页 |
2.4 SparkSQL与Hive on Spark的关系及互相调用方式 | 第22-23页 |
2.5 DubboRPC框架原理说明 | 第23-26页 |
第三章 用户上网终端的识别算法优化与实现 | 第26-34页 |
3.1 终端识别技术现状 | 第26-27页 |
3.2 终端数据特点分析 | 第27-28页 |
3.3 终端识别算法概述 | 第28-29页 |
3.4 基于Spark的终端识别算法的实现 | 第29-32页 |
3.4.1 任务运行环境及输入数据示例 | 第29-30页 |
3.4.2 由手机型号、操作系统型号版本、浏览器型号版本构成的识别算法 | 第30-32页 |
3.4.3 由厂商信息构成的识别算法 | 第32页 |
3.5 结果展示和分析 | 第32-34页 |
第四章 基于用户流量数据的数据比对归并算法 | 第34-43页 |
4.1 基于SparkCore的数据比对归并算法 | 第34-38页 |
4.1.1 SparkCore模块与用户行为分析平台 | 第34-35页 |
4.1.2 基于SparkCore的数据比对归并算法的实现 | 第35-38页 |
4.2 基于SparkGraphx的数据比对归并算法 | 第38-42页 |
4.2.1 实验环境及算法概述 | 第38-39页 |
4.2.2 基于SparkGraphx的数据比对归并算法的实现 | 第39-40页 |
4.2.3 脏数据定位算法 | 第40-42页 |
4.3 任务结果分析 | 第42-43页 |
第五章 基于SparkSQL的智慧机场人群调度分析 | 第43-60页 |
5.1 智慧机场项目背景 | 第43-45页 |
5.2 机场被调度人群轨迹分析任务算法原理 | 第45-55页 |
5.2.1 原始数据分析 | 第45-47页 |
5.2.2 Hive数据仓库表设计说明 | 第47-51页 |
5.2.3 被调度人群经纬度补全算法 | 第51-53页 |
5.2.4 被调度人群轨迹识别算法 | 第53-55页 |
5.3 机场被调度人群轨迹分析任务结果分析 | 第55-59页 |
5.3.1 被调度人群经纬度补全后数据展示 | 第55页 |
5.3.2 轨迹识别算法确定的被调度人群轨迹展示 | 第55-56页 |
5.3.3 Hive中的数据表数据展示 | 第56-57页 |
5.3.4 前端页面数据展示 | 第57-59页 |
5.4 任务结果分析 | 第59-60页 |
第六章 基于DubboRPC框架的用户行为分析平台监测系统的搭建 | 第60-71页 |
6.1 监测系统技术现状 | 第60-61页 |
6.2 基于DubboRPC框架的用户行为分析平台监测系统原理 | 第61-64页 |
6.2.1 用户行为分析平台的监测系统概述 | 第62页 |
6.2.2 DubboPRC框架功能说明 | 第62页 |
6.2.3 Dubbo配置 | 第62-64页 |
6.3 监测系统框架及监测内容说明 | 第64-69页 |
6.3.1 监测系统框架 | 第64-66页 |
6.3.2 各监测指标及采集方式说明 | 第66-68页 |
6.3.3 告警功能说明 | 第68-69页 |
6.4 监控结果展现与分析 | 第69-71页 |
第七章 总结与展望 | 第71-73页 |
参考文献 | 第73-75页 |
致谢 | 第75页 |