一种集群监控容错系统的设计与实现
摘要 | 第1-5页 |
ABSTRACT | 第5-13页 |
第一章 绪论 | 第13-18页 |
·研究背景及意义 | 第13-16页 |
·课题需求 | 第13-14页 |
·技术背景 | 第14-16页 |
·本文主要研究内容 | 第16页 |
·本文章节安排 | 第16-18页 |
第二章 集群监控容错系统总体设计 | 第18-27页 |
·系统主要功能需求 | 第18-20页 |
·总体框架设计 | 第20-21页 |
·软件体系架构设计 | 第21-26页 |
·客户端模块 | 第22-23页 |
·管理节点模块 | 第23-25页 |
·计算节点模块 | 第25页 |
·通信模块 | 第25-26页 |
·本章小结 | 第26-27页 |
第三章 集群监控 | 第27-46页 |
·集群监控系统的研究现状 | 第27-28页 |
·集群监控模块设计 | 第28-32页 |
·结构功能设计 | 第28-29页 |
·监控模块通信设计 | 第29-32页 |
·监控通信模式 | 第30-31页 |
·监控通信协议 | 第31-32页 |
·集群监控模块的实现 | 第32-42页 |
·NodeMonitor 模块 | 第32-36页 |
·常见的监控采集方法 | 第32-34页 |
·计算节点监控信息 | 第34-36页 |
·MonitorManage 模块 | 第36-38页 |
·UserMonitor 模块 | 第38-42页 |
·效果展示 | 第42-45页 |
·节点监控 | 第42-43页 |
·作业监控 | 第43-45页 |
·本章小结 | 第45-46页 |
第四章 集群系统容错 | 第46-72页 |
·集群系统容错技术研究 | 第46-51页 |
·系统容错概述 | 第46-47页 |
·容错技术研究 | 第47-48页 |
·检查点技术研究 | 第48-51页 |
·检查点技术的分类 | 第48-49页 |
·检查点技术的应用 | 第49-50页 |
·现有的检查点库技术 | 第50-51页 |
·集群容错模块总体设计 | 第51-53页 |
·计算节点容错设计 | 第53-56页 |
·计算节点故障检测 | 第53-56页 |
·计算节点故障处理 | 第56页 |
·面向应用的作业检查点设计 | 第56-66页 |
·地震数据处理作业的研究 | 第57-58页 |
·作业检查点的设计思路 | 第58-60页 |
·作业检查点的实现 | 第60-62页 |
·作业检查点数据结构 | 第60-61页 |
·作业检查点功能 API | 第61-62页 |
·作业检查点设置与回卷恢复流程 | 第62-66页 |
·作业检查点设置详细流程设计 | 第63-64页 |
·作业检查点回卷恢复流程设计 | 第64-66页 |
·实验与分析 | 第66-71页 |
·实验平台 | 第66页 |
·实验方法 | 第66-67页 |
·实验结果与分析 | 第67-71页 |
·节点故障检测功能 | 第67页 |
·作业检查点功能 | 第67-71页 |
·本章小结 | 第71-72页 |
第五章 结束语 | 第72-74页 |
·工作总结 | 第72页 |
·工作展望 | 第72-74页 |
致谢 | 第74-75页 |
参考文献 | 第75-78页 |
攻硕期间取得的研究成果 | 第78-79页 |