第一章 绪论 | 第1-20页 |
1.1 研究目的及意义 | 第11-13页 |
1.2 新一代高性能作业管理系统的研究进展 | 第13-17页 |
1.2.1 系统组成的研究 | 第13-15页 |
1.2.2 对实现方法的研究 | 第15-17页 |
1.3 研究工作概述 | 第17-20页 |
1.3.1 研究背景 | 第17页 |
1.3.2 本文的主要工作 | 第17-19页 |
1.3.3 本文的组织 | 第19-20页 |
第二章 CJobCenter系统组成 | 第20-36页 |
2.1 CJobCenter系统概述 | 第20-22页 |
2.1.1 集群技术的特点 | 第20-22页 |
2.1.2 CJobCenter系统中集群的构成方式 | 第22页 |
2.2 CJobCenter系统的模型和特征 | 第22-26页 |
2.2.1 CJobCenter系统的模型 | 第22-23页 |
2.2.2 CJobCenter系统的特征 | 第23-26页 |
2.3 CJobCenter系统中资源管理的机制 | 第26-30页 |
2.4 CJobCenter系统中的关键技术 | 第30-35页 |
2.4.1 工作组集群资源管理 | 第30-32页 |
2.4.2 负载集群的资源管理 | 第32-34页 |
2.4.3 高可用性和可扩展性 | 第34-35页 |
2.4.4 关联作业 | 第35页 |
2.5 小结 | 第35-36页 |
第三章 基于拟序的关联作业 | 第36-49页 |
3.1 关联作业综述 | 第36-39页 |
3.1.1 关联作业的特点 | 第36-37页 |
3.1.2 关联作业的构成 | 第37-38页 |
3.1.3 作业在CJobCenter系统中的生存周期 | 第38-39页 |
3.2 关联作业模型 | 第39-44页 |
3.3 关联作业的预调度实现 | 第44-47页 |
3.3.1 关联作业的提交方式 | 第44页 |
3.3.2 关联作业的预调度方法 | 第44-45页 |
3.3.3 关联作业的数据结构 | 第45-46页 |
3.3.4 关联作业生成算法 | 第46-47页 |
3.3.5 按照阶位值设置作业优先级算法 | 第47页 |
3.4 关联作业正确性检验 | 第47-48页 |
3.5 小结 | 第48-49页 |
第四章 工作组集群作业分散方法研究 | 第49-74页 |
4.1 工作组集群构成 | 第49-51页 |
4.2 工作组集群作业分散管理 | 第51-59页 |
4.2.1 工作组集群中作业分散的实现 | 第51-58页 |
4.2.2 工作组集群中的节点管理 | 第58-59页 |
4.3 作业执行参数确定情况下的作业分散方法 | 第59-62页 |
4.3.1 队列状态的表示方法 | 第59-60页 |
4.3.2 调度算法 | 第60-62页 |
4.4 动态作业分散方法 | 第62-71页 |
4.4.1 平均轮循法 | 第63页 |
4.4.2 负载信息收集法 | 第63-68页 |
4.4.3 请求转送法 | 第68-71页 |
4.5 调度方法评价 | 第71-73页 |
4.6 小结 | 第73-74页 |
第五章 基于交易模型的负载共享技术 | 第74-112页 |
5.1 CJobCenter系统资源共享概述 | 第74-76页 |
5.1.1 为什么在CJobCenter系统中实现资源共享 | 第74-75页 |
5.1.2 CJobCenter系统中交易模型的要求 | 第75-76页 |
5.1.3 交易模型与普通资源分配机制的比较 | 第76页 |
5.2 交易模型设计 | 第76-86页 |
5.2.1 交易模型 | 第76-78页 |
5.2.2 委托单生成 | 第78-84页 |
5.2.3 交易实现过程中的几种策略 | 第84-86页 |
5.3 局域网内交易模型的实现 | 第86-92页 |
5.3.1 局域网内交易实现过程 | 第86-87页 |
5.3.2 局域网内交易过程中作业启动协议 | 第87-88页 |
5.3.3 局域网内交易模型中服务进程的数据结构和实现算法 | 第88-92页 |
5.4 广域网环境下交易过程的实现 | 第92-98页 |
5.4.1 WAN环境下交易模型结构 | 第92-93页 |
5.4.2 WAN环境下作业启动协议 | 第93-95页 |
5.4.3 WAN环境下交易模型中服务进程的数据结构和算法实现 | 第95-98页 |
5.5 考虑网络延时情况交易算法的改进 | 第98-107页 |
5.5.1 一般交易算法中的问题 | 第98页 |
5.5.2 作业执行中的检测点技术 | 第98-99页 |
5.5.3 CJobCenter系统中作业执行模型 | 第99-101页 |
5.5.4 通信条件的一些特征 | 第101-105页 |
5.5.5 两种代价标准 | 第105-106页 |
5.5.6 考虑网络延时情况的交易算法 | 第106-107页 |
5.6 性能评价 | 第107-111页 |
5.6.1 负载共享质量评价法 | 第108-110页 |
5.6.2 交易算法资源可用性测量 | 第110-111页 |
5.7 小结 | 第111-112页 |
第六章 CJobCenter系统的高可用性研究 | 第112-126页 |
6.1 .CJobCenter系统的高可用性概述 | 第112-114页 |
6.1.1 节点故障的来源 | 第112-113页 |
6.1.2 CJobCenter系统高可用性的设计目标 | 第113-114页 |
6.2 CJobCenter系统结构对高可用性的支持 | 第114-116页 |
6.2.1 ClusterPro的硬件的配置 | 第114-115页 |
6.2.2 ClusterPro的软件配置 | 第115-116页 |
6.2.3 ClusterPro的内部连接方式 | 第116页 |
6.3 作业在节点出现故障情况下的运行方式 | 第116-117页 |
6.4 CJobCenter系统高可用性的实现 | 第117-125页 |
6.4.1 失效接管组 | 第117-119页 |
6.4.2 ARM客户端API | 第119页 |
6.4.3 监视器 | 第119-120页 |
6.4.4 高可用性集群节点的恢复过程算法 | 第120页 |
6.4.5 失效接管过程 | 第120-123页 |
6.4.6 故障节点的作业在ARM上的生命周期 | 第123-125页 |
6.5 小结 | 第125-126页 |
第七章 结论与展望 | 第126-128页 |
致谢 | 第128-129页 |
主要参考文献 | 第129-137页 |
作者在学习期间从事科研工作及发表论文情况 | 第137页 |