摘要 | 第1-11页 |
ABSTRACT | 第11-13页 |
第一章 绪论 | 第13-25页 |
·课题背景 | 第13-15页 |
·大规模并行系统可靠性设计 | 第15-21页 |
·国内外研究现状 | 第15-19页 |
·容错技术发展趋势 | 第19-21页 |
·课题研究内容 | 第21-23页 |
·课题来源 | 第21页 |
·课题内容与目标 | 第21-22页 |
·重点问题与创新点 | 第22-23页 |
·论文结构 | 第23-25页 |
第二章 基于机器学习的E 级系统容错模型设计 | 第25-45页 |
·故障与容错 | 第26-30页 |
·故障、差错、失效 | 第26-27页 |
·并行系统故障模型 | 第27页 |
·容错控制技术 | 第27-28页 |
·冗余容错方法 | 第28-30页 |
·E 级系统的自治主被动容错模型 | 第30-35页 |
·现有容错模型缺陷 | 第30-32页 |
·结点级主动容错模型 | 第32-34页 |
·主被动融合的双层次容错模型 | 第34-35页 |
·基于机器学习的E 级系统在线故障预测模型 | 第35-43页 |
·机器学习技术 | 第36-37页 |
·基于机器学习的在线故障预测模型 | 第37-41页 |
·支持规模扩展的多学习结点系统模型 | 第41-43页 |
·在线故障预测关键技术 | 第43-44页 |
·本章小结 | 第44-45页 |
第三章 系统状态信息的收集及预处理方法的设计与实现 | 第45-69页 |
·系统状态信息的采集 | 第45-52页 |
·状态信息描述 | 第45-46页 |
·Linux 日志系统 | 第46-47页 |
·结点日志采集 | 第47-52页 |
·系统状态信息的汇总 | 第52-61页 |
·网络及文件操作接口 | 第52-55页 |
·日志文件收发的实现 | 第55-57页 |
·日志收发过程的配置 | 第57-61页 |
·系统日志信息的预处理 | 第61-67页 |
·无用日志信息 | 第61-62页 |
·相关方法介绍 | 第62-63页 |
·IASF 方法的设计与实现 | 第63-67页 |
·本章小结 | 第67-69页 |
第四章 系统状态特征的获取及提取方法的设计与实现 | 第69-88页 |
·故障特征参数的设计 | 第69-72页 |
·常用故障特征参数 | 第69-70页 |
·基于系统日志的故障特征参数设计 | 第70-72页 |
·日志特征参数的获取 | 第72-81页 |
·系统时间窗口的划分与设定 | 第72-74页 |
·日志故障特征参数的计算 | 第74-78页 |
·故障特征参数集的构建 | 第78-81页 |
·故障特征参数的提取 | 第81-87页 |
·主成分分析方法 | 第82-84页 |
·线性判别分析方法 | 第84-86页 |
·故障特征参数的提取方式 | 第86-87页 |
·本章小结 | 第87-88页 |
第五章 故障预测规则的生成与应用方法的设计与实现 | 第88-99页 |
·故障特征参数的离散化 | 第88-90页 |
·决策树的机器学习方法 | 第90-95页 |
·算法处理过程 | 第90-94页 |
·算法程序实现 | 第94-95页 |
·基于决策树的规则生成 | 第95-96页 |
·故障预测规则生成的总体流程 | 第96-97页 |
·基于规则的结点故障预测 | 第97-98页 |
·本章小结 | 第98-99页 |
第六章 实验测试与方法评估 | 第99-114页 |
·实验系统介绍 | 第99-100页 |
·实验测试流程 | 第100-102页 |
·实验测试结果 | 第102-107页 |
·日志冗余信息过滤 | 第103-104页 |
·故障特征参数提取 | 第104-105页 |
·故障预测规则生成 | 第105-106页 |
·系统结点故障预测 | 第106-107页 |
·方法对比与评估 | 第107-113页 |
·日志预处理方法评估 | 第107-109页 |
·特征提取方法评估 | 第109-111页 |
·故障预测模型参数评估 | 第111-113页 |
·本章小结 | 第113-114页 |
结束语 | 第114-116页 |
致谢 | 第116-118页 |
参考文献 | 第118-124页 |
作者在学期间取得的学术成果 | 第124页 |