一种集群监控容错系统的设计与实现
| 摘要 | 第1-5页 |
| ABSTRACT | 第5-13页 |
| 第一章 绪论 | 第13-18页 |
| ·研究背景及意义 | 第13-16页 |
| ·课题需求 | 第13-14页 |
| ·技术背景 | 第14-16页 |
| ·本文主要研究内容 | 第16页 |
| ·本文章节安排 | 第16-18页 |
| 第二章 集群监控容错系统总体设计 | 第18-27页 |
| ·系统主要功能需求 | 第18-20页 |
| ·总体框架设计 | 第20-21页 |
| ·软件体系架构设计 | 第21-26页 |
| ·客户端模块 | 第22-23页 |
| ·管理节点模块 | 第23-25页 |
| ·计算节点模块 | 第25页 |
| ·通信模块 | 第25-26页 |
| ·本章小结 | 第26-27页 |
| 第三章 集群监控 | 第27-46页 |
| ·集群监控系统的研究现状 | 第27-28页 |
| ·集群监控模块设计 | 第28-32页 |
| ·结构功能设计 | 第28-29页 |
| ·监控模块通信设计 | 第29-32页 |
| ·监控通信模式 | 第30-31页 |
| ·监控通信协议 | 第31-32页 |
| ·集群监控模块的实现 | 第32-42页 |
| ·NodeMonitor 模块 | 第32-36页 |
| ·常见的监控采集方法 | 第32-34页 |
| ·计算节点监控信息 | 第34-36页 |
| ·MonitorManage 模块 | 第36-38页 |
| ·UserMonitor 模块 | 第38-42页 |
| ·效果展示 | 第42-45页 |
| ·节点监控 | 第42-43页 |
| ·作业监控 | 第43-45页 |
| ·本章小结 | 第45-46页 |
| 第四章 集群系统容错 | 第46-72页 |
| ·集群系统容错技术研究 | 第46-51页 |
| ·系统容错概述 | 第46-47页 |
| ·容错技术研究 | 第47-48页 |
| ·检查点技术研究 | 第48-51页 |
| ·检查点技术的分类 | 第48-49页 |
| ·检查点技术的应用 | 第49-50页 |
| ·现有的检查点库技术 | 第50-51页 |
| ·集群容错模块总体设计 | 第51-53页 |
| ·计算节点容错设计 | 第53-56页 |
| ·计算节点故障检测 | 第53-56页 |
| ·计算节点故障处理 | 第56页 |
| ·面向应用的作业检查点设计 | 第56-66页 |
| ·地震数据处理作业的研究 | 第57-58页 |
| ·作业检查点的设计思路 | 第58-60页 |
| ·作业检查点的实现 | 第60-62页 |
| ·作业检查点数据结构 | 第60-61页 |
| ·作业检查点功能 API | 第61-62页 |
| ·作业检查点设置与回卷恢复流程 | 第62-66页 |
| ·作业检查点设置详细流程设计 | 第63-64页 |
| ·作业检查点回卷恢复流程设计 | 第64-66页 |
| ·实验与分析 | 第66-71页 |
| ·实验平台 | 第66页 |
| ·实验方法 | 第66-67页 |
| ·实验结果与分析 | 第67-71页 |
| ·节点故障检测功能 | 第67页 |
| ·作业检查点功能 | 第67-71页 |
| ·本章小结 | 第71-72页 |
| 第五章 结束语 | 第72-74页 |
| ·工作总结 | 第72页 |
| ·工作展望 | 第72-74页 |
| 致谢 | 第74-75页 |
| 参考文献 | 第75-78页 |
| 攻硕期间取得的研究成果 | 第78-79页 |