面向高效能计算的大规模资源管理技术研究与实现
| 摘要 | 第1-14页 |
| ABSTRACT | 第14-16页 |
| 第一章 绪论 | 第16-32页 |
| ·研究背景 | 第16-22页 |
| ·高性能计算机系统现状 | 第16-20页 |
| ·从高峰值到高效能 | 第20-22页 |
| ·相关工作 | 第22-29页 |
| ·主流高性能计算资源管理系统 | 第22-24页 |
| ·系统可靠性技术 | 第24-26页 |
| ·系统低功耗技术 | 第26-28页 |
| ·高效能计算系统的资源管理面临的主要问题 | 第28-29页 |
| ·论文主要工作和贡献 | 第29-31页 |
| ·论文结构 | 第31-32页 |
| 第二章 面向高效能计算的深度资源信息模型 | 第32-61页 |
| ·S2MP 体系结构简述 | 第33-35页 |
| ·DRIM 资源信息模型 | 第35-36页 |
| ·典型的实体模型 | 第36-46页 |
| ·多核结构模型 | 第36-39页 |
| ·互连网络模型 | 第39-43页 |
| ·分布存储模型 | 第43-46页 |
| ·动态逻辑分区功能模型 | 第46-50页 |
| ·动态逻辑分区对象定义 | 第46-48页 |
| ·动态逻辑分区管理 | 第48-50页 |
| ·多模式应用模型 | 第50-55页 |
| ·并行应用模型的定义 | 第50-52页 |
| ·任务管理接口的定义与实现 | 第52-54页 |
| ·应用I/O 能力需求分级模型 | 第54-55页 |
| ·深度资源信息模型DRIM 的构建方法 | 第55-61页 |
| ·通用信息模型 | 第56-57页 |
| ·DRIM 模型构建 | 第57-61页 |
| 第三章 大规模资源管理系统的可扩展技术 | 第61-98页 |
| ·研究背景 | 第61-64页 |
| ·相关研究 | 第61-63页 |
| ·可扩展性研究目前存在的问题和策略 | 第63-64页 |
| ·资源管理系统可扩展层次式级联结构 | 第64-73页 |
| ·动态层次式级联资源管理结构 | 第64-66页 |
| ·可扩展级联服务的动态自组织构建方法 | 第66-70页 |
| ·基于构件机制的资源管理功能扩展 | 第70-73页 |
| ·可扩展资源管理协议优化设计 | 第73-81页 |
| ·基于硬件通信操作的资源管理协议优化设计 | 第73-75页 |
| ·结点状态监控协议优化设计 | 第75-78页 |
| ·大规模作业加载协议优化设计 | 第78-81页 |
| ·可扩展调度策略设计 | 第81-87页 |
| ·综合优先级的调度策略 | 第82-85页 |
| ·可变深度Backfill 策略 | 第85-87页 |
| ·可扩展性测试与分析 | 第87-98页 |
| ·资源管理协议的性能测试与分析 | 第88-90页 |
| ·作业加载性能测试与分析 | 第90-93页 |
| ·应用程序的性能测试 | 第93-95页 |
| ·MC_Backfill 调度策略性能测试与分析 | 第95-98页 |
| 第四章 大规模资源管理系统的可靠性管理技术 | 第98-121页 |
| ·相关研究 | 第98-99页 |
| ·高性能计算系统故障模型 | 第99-105页 |
| ·高性能计算机系统故障分类 | 第100-101页 |
| ·高性能计算系统故障模型及其参数估计 | 第101-104页 |
| ·基于检查点/恢复技术的作业容错执行时间模型 | 第104-105页 |
| ·面向可靠性的资源管理方法 | 第105-109页 |
| ·面向可靠性的作业检查点周期选择算法 | 第106-107页 |
| ·面向可靠性的最优结点集合选择方法 | 第107-109页 |
| ·基于检查点/恢复模型的作业自动容错机制 | 第109-114页 |
| ·自动容错实现结构 | 第109-110页 |
| ·作业自动容错实现流程 | 第110-113页 |
| ·系统的可用度测量 | 第113-114页 |
| ·实验与测试 | 第114-121页 |
| ·系统故障模型参数的获取 | 第115-116页 |
| ·固定并行度作业最优检查周期测试 | 第116-117页 |
| ·优化并行度作业最优检查周期测试 | 第117-119页 |
| ·自动容错对性能的影响 | 第119-121页 |
| 第五章 大规模资源管理系统的能耗管理技术 | 第121-151页 |
| ·相关研究 | 第121-124页 |
| ·并行计算机能耗优化 | 第121-123页 |
| ·动态电压调节 | 第123-124页 |
| ·自适应并行技术 | 第124页 |
| ·系统级能耗管理 | 第124-129页 |
| ·能耗约束下的资源分配方法 | 第125-128页 |
| ·能耗管理功能实现 | 第128-129页 |
| ·应用级能耗管理 | 第129-141页 |
| ·基于负反馈的能耗控制模型 | 第130-133页 |
| ·两级并发度控制算法 | 第133-138页 |
| ·控制框架的实现 | 第138-141页 |
| ·测试与分析 | 第141-151页 |
| ·测试环境介绍 | 第141页 |
| ·系统级能耗管理测试 | 第141-143页 |
| ·应用级能耗管理的测试 | 第143-151页 |
| 第六章 结束语 | 第151-154页 |
| 致谢 | 第154-155页 |
| 参考文献 | 第155-166页 |
| 作者近年发表的学术论文 | 第166-168页 |
| 作者近年获得的科技奖励 | 第168页 |
| 作者近年参加的主要科研工作 | 第168页 |