摘要 | 第9-10页 |
ABSTRACT | 第10页 |
第一章 绪论 | 第11-14页 |
1.1 研究背景与意义 | 第11-12页 |
1.2 研究目的与内容 | 第12页 |
1.3 论文的组织结构 | 第12-14页 |
第二章 课题相关技术 | 第14-22页 |
2.1 基本概念 | 第14-16页 |
2.1.1 可靠性、可用性和可维护性 | 第14页 |
2.1.2 高可用技术发展现状 | 第14-15页 |
2.1.3 Linux故障管理现状 | 第15-16页 |
2.2 技术基础 | 第16-21页 |
2.2.1 Linux HA | 第16-17页 |
2.2.2 故障管理(Fault Management) | 第17-18页 |
2.2.3 硬件故障检测技术 | 第18-19页 |
2.2.4 Kernel Trace框架 | 第19-21页 |
2.3 小结 | 第21-22页 |
第三章 Daemon模式下单机故障管理框架 | 第22-34页 |
3.1 故障管理设计 | 第22-24页 |
3.1.1 硬件错误报告机制(Hard Error Reporting Mechanism) | 第22-23页 |
3.1.2 Daemon实时监控设计 | 第23-24页 |
3.2 单机故障管理框架 | 第24-33页 |
3.2.1 故障检测机制 | 第25-30页 |
3.2.2 故障封装流程 | 第30-33页 |
3.3 小结 | 第33-34页 |
第四章 KYLIN故障管理机制的多机实现 | 第34-60页 |
4.1 多机故障监测设计 | 第34-47页 |
4.1.1 Kylin HA的实现 | 第34-44页 |
4.1.2 Event Tracing机制 | 第44-45页 |
4.1.3 自动化故障处理原理 | 第45-47页 |
4.2 基于Kylin HA的多机故障管理 | 第47-59页 |
4.2.1 基于Event Tracing的故障传递机制 | 第47-53页 |
4.2.2 多机故障处理流程 | 第53-59页 |
4.3 小结 | 第59-60页 |
第五章 高可用故障管理测试 | 第60-75页 |
5.1 故障注入测试 | 第60-70页 |
5.1.1 测试环境 | 第60页 |
5.1.2 测试原理 | 第60-64页 |
5.1.3 测试步骤与结果 | 第64-70页 |
5.2 通用HA测试 | 第70-74页 |
5.1.1 测试环境 | 第70页 |
5.1.2 测试原理 | 第70-71页 |
5.1.3 测试步骤与结果 | 第71-74页 |
5.3 小结 | 第74-75页 |
结束语 | 第75-76页 |
致谢 | 第76-77页 |
参考文献 | 第77-80页 |
作者在学期间取得的学术成果 | 第80页 |