摘要 | 第5-6页 |
abstract | 第6-7页 |
第一章 绪论 | 第11-18页 |
1.1 研究背景与意义 | 第11-13页 |
1.2 国内外研究现状 | 第13-16页 |
1.2.1 HADOOP集群监控发展现状 | 第13-14页 |
1.2.2 用户行为异常检测研究现状 | 第14-16页 |
1.3 论文主要研究内容 | 第16-17页 |
1.4 本文的组织结构 | 第17-18页 |
第二章 相关技术研究 | 第18-32页 |
2.1 HADOOP相关技术理论 | 第18-22页 |
2.1.1 HDFS中存在的角色及数据访问 | 第18-20页 |
2.1.2 MAPREDUCE处理分析 | 第20-22页 |
2.2 HADOOP集群监控技术 | 第22-26页 |
2.2.1 Ganglia监控框架分析 | 第23-24页 |
2.2.2 Nagios监控分析 | 第24-26页 |
2.3 日志数据缓存队列KAFKA | 第26-27页 |
2.3.1 Kafka框架研究 | 第26页 |
2.3.2 基于Kafka的HDFS审计日志收集优势分析 | 第26-27页 |
2.4 实时流式处理平台STORM | 第27-29页 |
2.4.1 实时流数据处理概述 | 第27-28页 |
2.4.2 Storm集群流式处理框架分析 | 第28-29页 |
2.5 异常检测方法研究 | 第29-30页 |
2.5.1 异常检测概述 | 第29-30页 |
2.5.2 异常检测方法分析 | 第30页 |
2.6 本章小结 | 第30-32页 |
第三章 基于审计日志和主成分分析的异常检测方法 | 第32-50页 |
3.1 引言 | 第32页 |
3.2 本文异常检测关键问题分析 | 第32-33页 |
3.3 主成分分析处理过程 | 第33-35页 |
3.4 主成分分析算法并行化 | 第35-39页 |
3.4.1 传统主成分分析缺点 | 第35-36页 |
3.4.2 主成分分析并行化设计 | 第36-37页 |
3.4.3 主成分分析并行化时间复杂度分析 | 第37-38页 |
3.4.4 主成分分析并行化实现 | 第38-39页 |
3.5 用户行为异常检测框架 | 第39-40页 |
3.6 数据准备阶段 | 第40-41页 |
3.6.1 数据收集 | 第40页 |
3.6.2 数据预处理 | 第40-41页 |
3.7 基于审计日志和主成分分析的异常检测 | 第41-48页 |
3.7.1 用户行为模型训练阶段 | 第42-44页 |
3.7.2 用户行为模型训练算法 | 第44-45页 |
3.7.3 用户行为异常检测阶段 | 第45-47页 |
3.7.4 用户行为异常检测算法 | 第47页 |
3.7.5 用户行为异常检测流程 | 第47-48页 |
3.8 本文异常检测模型评价指标 | 第48-49页 |
3.9 本章总结 | 第49-50页 |
第四章 Hadoop集群资源监控和行为异常检测系统设计及实现 | 第50-64页 |
4.1 现有Hadoop集群监控系统缺陷分析 | 第50-51页 |
4.2 Hadoop集群资源监控框架整合设计 | 第51-55页 |
4.2.1 Hadoop和Ganglia集成 | 第51-52页 |
4.2.2 Ganglia和Nagios整合设计 | 第52-54页 |
4.2.3 整合设计关键模块实现 | 第54-55页 |
4.3 用户行为异常检测系统的设计与实现 | 第55-63页 |
4.3.1 用户行为异常检测系统架构设计 | 第55-56页 |
4.3.2 日志收集模块设计与实现 | 第56-58页 |
4.3.3 离线训练模块设计与实现 | 第58-60页 |
4.3.4 在线检测模块设计与实现 | 第60-62页 |
4.3.5 检测系统生产环境部署 | 第62-63页 |
4.4 本章小结 | 第63-64页 |
第五章 系统实验设计与分析 | 第64-76页 |
5.1 实验环境 | 第64-67页 |
5.2 实验过程与结果分析 | 第67-75页 |
5.2.1 资源监控整合实验 | 第67-70页 |
5.2.2 用户行为监控实验 | 第70-75页 |
5.3 本章小结 | 第75-76页 |
第六章 总结与展望 | 第76-78页 |
6.1 工作总结 | 第76-77页 |
6.2 未来展望 | 第77-78页 |
致谢 | 第78-79页 |
参考文献 | 第79-83页 |
攻读硕士学位期间取得的成果 | 第83-84页 |