面向用户请求路径的分布式系统监控关键技术研究
摘要 | 第11-13页 |
ABSTRACT | 第13-15页 |
第一章 绪论 | 第16-46页 |
1.1 研究背景 | 第16-27页 |
1.1.1 分布式系统概述 | 第16-19页 |
1.1.2 分布式系统中的异常 | 第19-21页 |
1.1.3 系统监控概述 | 第21-24页 |
1.1.4 面向请求路径系统监控技术面临的挑战 | 第24-27页 |
1.2 相关工作 | 第27-42页 |
1.2.1 系统行为跟踪 | 第27-34页 |
1.2.2 相关数据集 | 第34-38页 |
1.2.3 异常检测和诊断 | 第38-42页 |
1.3 本文工作 | 第42-45页 |
1.4 论文结构 | 第45-46页 |
第二章 轻量级的白盒跟踪方法 | 第46-70页 |
2.1 引言 | 第46-47页 |
2.2 MTracer概述 | 第47-48页 |
2.3 数据收集 | 第48-56页 |
2.3.1 请求树介绍 | 第49-50页 |
2.3.2 请求树的记录 | 第50-53页 |
2.3.3 请求树的恢复 | 第53-56页 |
2.4 数据存储 | 第56-59页 |
2.4.1 数据库表格 | 第56-57页 |
2.4.2 并行存储 | 第57-58页 |
2.4.3 优化策略 | 第58-59页 |
2.5 数据展示 | 第59-62页 |
2.5.1 用户请求视角 | 第59-60页 |
2.5.2 系统操作视角 | 第60-61页 |
2.5.3 例子 | 第61-62页 |
2.6 评估 | 第62-68页 |
2.6.1 处理能力 | 第63-66页 |
2.6.2 额外开销 | 第66-67页 |
2.6.3 实际应用 | 第67页 |
2.6.4 讨论 | 第67-68页 |
2.7 小结 | 第68-70页 |
第三章 细粒度、多场景的请求路径数据集 | 第70-94页 |
3.1 引言 | 第70-71页 |
3.2 数据集介绍 | 第71-77页 |
3.2.1 数据集的结构 | 第71-73页 |
3.2.2 数据集的组成部分 | 第73-75页 |
3.2.3 数据集统计 | 第75页 |
3.2.4 路径示例 | 第75-77页 |
3.3 数据集收集 | 第77-83页 |
3.3.1 收集环境的设计与搭建 | 第77-78页 |
3.3.2 数据收集过程 | 第78-80页 |
3.3.3 数据收集中使用的负载 | 第80-81页 |
3.3.4 数据收集中注入的故障 | 第81-83页 |
3.4 数据分析 | 第83-87页 |
3.4.1 处理速度分析 | 第83-84页 |
3.4.2 负载均衡分析 | 第84-85页 |
3.4.3 功能异常分析 | 第85-86页 |
3.4.4 性能异常分析 | 第86-87页 |
3.5 数据集的应用 | 第87-91页 |
3.5.1 异常检测 | 第87-88页 |
3.5.2 性能异常诊断 | 第88-89页 |
3.5.3 不变式挖掘 | 第89-91页 |
3.6 讨论 | 第91-92页 |
3.6.1 收集工具 | 第91页 |
3.6.2 目标系统 | 第91-92页 |
3.6.3 收集场景 | 第92页 |
3.7 小结 | 第92-94页 |
第四章 基于运行时验证的异常检测方法 | 第94-112页 |
4.1 引言 | 第94页 |
4.2 系统行为特征建模 | 第94-98页 |
4.2.1 类型划分 | 第95页 |
4.2.2 系统功能特征 | 第95-96页 |
4.2.3 系统性能特征 | 第96-97页 |
4.2.4 特征的组合 | 第97-98页 |
4.3 HDFS中的性质 | 第98-102页 |
4.3.1 RPC操作相关性质 | 第98页 |
4.3.2 元数据操作请求相关性质 | 第98-99页 |
4.3.3 文件读请求相关性质 | 第99-102页 |
4.3.4 文件写请求相关性质 | 第102页 |
4.4 方法介绍 | 第102-109页 |
4.4.1 基本框架 | 第103页 |
4.4.2 监控器 | 第103-107页 |
4.4.3 监控器生成方法 | 第107-109页 |
4.5 评估 | 第109-111页 |
4.5.1 准确度 | 第109-111页 |
4.5.2 效率 | 第111页 |
4.6 小结 | 第111-112页 |
第五章 基于路径分割的性能异常诊断方法 | 第112-136页 |
5.1 引言 | 第112-113页 |
5.2 方法概述 | 第113-116页 |
5.2.1 问题描述 | 第113-114页 |
5.2.2 Seg Diag总体框架 | 第114-116页 |
5.3 自动分割算法 | 第116-121页 |
5.3.1 子路径簇的评价标准 | 第116-117页 |
5.3.2 算法设计 | 第117-119页 |
5.3.3 例子 | 第119-120页 |
5.3.4 分割带来的好处 | 第120-121页 |
5.4 异常事件定位 | 第121-127页 |
5.4.1 异常路径检测 | 第121-123页 |
5.4.2 异常事件检测 | 第123-124页 |
5.4.3 循环 | 第124-127页 |
5.5 综合投票机制 | 第127-129页 |
5.5.1 故障指标评分方法 | 第127页 |
5.5.2 异常事件评分方法 | 第127-129页 |
5.6 实验 | 第129-134页 |
5.6.1 实验设置 | 第129-130页 |
5.6.2 准确度 | 第130-132页 |
5.6.3 效率 | 第132-133页 |
5.6.4 讨论 | 第133-134页 |
5.7 小结 | 第134-136页 |
第六章 总结和展望 | 第136-140页 |
6.1 总结 | 第136-137页 |
6.2 展望 | 第137-140页 |
致谢 | 第140-144页 |
参考文献 | 第144-160页 |
作者在学期间取得的学术成果 | 第160-162页 |
作者在学期间参与的科研项目 | 第162页 |