面向高效能计算的大规模资源管理技术研究与实现
摘要 | 第1-14页 |
ABSTRACT | 第14-16页 |
第一章 绪论 | 第16-32页 |
·研究背景 | 第16-22页 |
·高性能计算机系统现状 | 第16-20页 |
·从高峰值到高效能 | 第20-22页 |
·相关工作 | 第22-29页 |
·主流高性能计算资源管理系统 | 第22-24页 |
·系统可靠性技术 | 第24-26页 |
·系统低功耗技术 | 第26-28页 |
·高效能计算系统的资源管理面临的主要问题 | 第28-29页 |
·论文主要工作和贡献 | 第29-31页 |
·论文结构 | 第31-32页 |
第二章 面向高效能计算的深度资源信息模型 | 第32-61页 |
·S2MP 体系结构简述 | 第33-35页 |
·DRIM 资源信息模型 | 第35-36页 |
·典型的实体模型 | 第36-46页 |
·多核结构模型 | 第36-39页 |
·互连网络模型 | 第39-43页 |
·分布存储模型 | 第43-46页 |
·动态逻辑分区功能模型 | 第46-50页 |
·动态逻辑分区对象定义 | 第46-48页 |
·动态逻辑分区管理 | 第48-50页 |
·多模式应用模型 | 第50-55页 |
·并行应用模型的定义 | 第50-52页 |
·任务管理接口的定义与实现 | 第52-54页 |
·应用I/O 能力需求分级模型 | 第54-55页 |
·深度资源信息模型DRIM 的构建方法 | 第55-61页 |
·通用信息模型 | 第56-57页 |
·DRIM 模型构建 | 第57-61页 |
第三章 大规模资源管理系统的可扩展技术 | 第61-98页 |
·研究背景 | 第61-64页 |
·相关研究 | 第61-63页 |
·可扩展性研究目前存在的问题和策略 | 第63-64页 |
·资源管理系统可扩展层次式级联结构 | 第64-73页 |
·动态层次式级联资源管理结构 | 第64-66页 |
·可扩展级联服务的动态自组织构建方法 | 第66-70页 |
·基于构件机制的资源管理功能扩展 | 第70-73页 |
·可扩展资源管理协议优化设计 | 第73-81页 |
·基于硬件通信操作的资源管理协议优化设计 | 第73-75页 |
·结点状态监控协议优化设计 | 第75-78页 |
·大规模作业加载协议优化设计 | 第78-81页 |
·可扩展调度策略设计 | 第81-87页 |
·综合优先级的调度策略 | 第82-85页 |
·可变深度Backfill 策略 | 第85-87页 |
·可扩展性测试与分析 | 第87-98页 |
·资源管理协议的性能测试与分析 | 第88-90页 |
·作业加载性能测试与分析 | 第90-93页 |
·应用程序的性能测试 | 第93-95页 |
·MC_Backfill 调度策略性能测试与分析 | 第95-98页 |
第四章 大规模资源管理系统的可靠性管理技术 | 第98-121页 |
·相关研究 | 第98-99页 |
·高性能计算系统故障模型 | 第99-105页 |
·高性能计算机系统故障分类 | 第100-101页 |
·高性能计算系统故障模型及其参数估计 | 第101-104页 |
·基于检查点/恢复技术的作业容错执行时间模型 | 第104-105页 |
·面向可靠性的资源管理方法 | 第105-109页 |
·面向可靠性的作业检查点周期选择算法 | 第106-107页 |
·面向可靠性的最优结点集合选择方法 | 第107-109页 |
·基于检查点/恢复模型的作业自动容错机制 | 第109-114页 |
·自动容错实现结构 | 第109-110页 |
·作业自动容错实现流程 | 第110-113页 |
·系统的可用度测量 | 第113-114页 |
·实验与测试 | 第114-121页 |
·系统故障模型参数的获取 | 第115-116页 |
·固定并行度作业最优检查周期测试 | 第116-117页 |
·优化并行度作业最优检查周期测试 | 第117-119页 |
·自动容错对性能的影响 | 第119-121页 |
第五章 大规模资源管理系统的能耗管理技术 | 第121-151页 |
·相关研究 | 第121-124页 |
·并行计算机能耗优化 | 第121-123页 |
·动态电压调节 | 第123-124页 |
·自适应并行技术 | 第124页 |
·系统级能耗管理 | 第124-129页 |
·能耗约束下的资源分配方法 | 第125-128页 |
·能耗管理功能实现 | 第128-129页 |
·应用级能耗管理 | 第129-141页 |
·基于负反馈的能耗控制模型 | 第130-133页 |
·两级并发度控制算法 | 第133-138页 |
·控制框架的实现 | 第138-141页 |
·测试与分析 | 第141-151页 |
·测试环境介绍 | 第141页 |
·系统级能耗管理测试 | 第141-143页 |
·应用级能耗管理的测试 | 第143-151页 |
第六章 结束语 | 第151-154页 |
致谢 | 第154-155页 |
参考文献 | 第155-166页 |
作者近年发表的学术论文 | 第166-168页 |
作者近年获得的科技奖励 | 第168页 |
作者近年参加的主要科研工作 | 第168页 |