基于Spark on Yarn的机房安全设备日志流分析设计与实现

中文摘要	第3-5页
Abstract	第5-6页
第1章绪论	第11-16页
1.1 研究背景与意义	第11页
1.2 国内外研究现状	第11-12页
1.3 本文主要研究工作	第12-14页
1.4 论文章节安排	第14-16页
第2章相关技术说明	第16-21页
2.1 大数据技术	第16-17页
2.2 实时流处理技术	第17页
2.3 实时流处理技术	第17-18页
2.4 Kafka技术	第18-19页
2.5 Flume技术	第19-20页
2.6 Spark On Yarn介绍	第20页
2.7 Zookeeper介绍	第20页
2.8 本章小结	第20-21页
第3章系统需求分析	第21-25页
3.1 需求概要	第21页
3.2 模块需求分解	第21-25页
3.2.1 数据收集	第21-22页
3.2.2 逻辑处理	第22-24页
3.2.3 数据分析	第24页
3.2.4 非功能性需求分析	第24-25页
3.3 本章小结	第25页
第4章系统设计	第25-38页
4.1 总体框架设计	第25-31页
4.1.1 总体架构图	第25-26页
4.1.2 存储框架设计	第26-27页
4.1.3 计算框架设计	第27-28页
4.1.4 资源管理框架设计	第28-29页
4.1.5 流处理框架设计	第29-31页
4.2 数据收集模块设计	第31-32页
4.2.1 Flume收集流程设计	第31-32页
4.3 逻辑处理模块设计	第32-35页
4.3.1 消息系统接收日志	第32页
4.3.2 日志流处理流程	第32-35页
4.4 数据分析模块设计	第35-37页
4.4.1 分析模块状态图	第35-36页
4.4.2 功能流程图设计	第36-37页
4.5 可视化模块设计	第37页
4.6 本章小结	第37-38页
第5章系统实现	第38-54页
5.1 环境搭建	第38-43页
5.1.1 Spark集群搭建	第38-41页
5.1.2 Hdfs文件系统结构	第41-42页
5.1.3 Flume环境搭建	第42页
5.1.4 Kafka环境搭建	第42-43页
5.2 数据收集模块关键技术实现	第43-49页
5.2.1 主要功能	第43页
5.2.2 关键技术总结	第43-46页
5.2.3 主要代码实现	第46-49页
5.3 逻辑处理模块关键技术实现	第49-53页
5.3.1 Kafka对接Flume	第49页
5.3.2 Spark Streaming对接Kafka	第49-51页
5.3.3 Spark Streaming主要逻辑	第51-53页
5.4 本章小结	第53-54页
第6章系统测试与性能优化	第54-60页
6.1 概述	第54页
6.2 搭建测试环境	第54-55页
6.3 系统测试结果	第55-57页
6.3.1 功能测试	第55-56页
6.3.2 安全性测试	第56页
6.3.3 稳定性测试	第56-57页
6.3.4 性能测试	第57页
6.4 系统性能分析	第57-59页
6.5 本章小结	第59-60页
结论	第60-61页
参考文献	第61-66页
致谢	第66-67页