首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--其他计算机论文

基于Torque的异构集群平台调度算法的设计与实现

摘要第1-4页
Abstract第4-7页
第一章 绪论第7-13页
   ·论文背景第7-9页
     ·高性能计算与集群第7-8页
     ·GPU 异构集群第8-9页
   ·相关技术及研究现状第9-10页
     ·集群管理系统的相关研究第9页
     ·作业调度的相关研究第9-10页
   ·本文的主要研究工作第10页
   ·章节安排第10-13页
第二章 集群管理与作业调度概述第13-23页
   ·主流集群管理系统的介绍第13-15页
     ·CONDOR第14页
     ·LVS第14-15页
     ·COMS第15页
   ·调度算法的介绍与分析第15-19页
     ·作业调度过程第16-17页
     ·常见的调度算法第17-19页
   ·调度器的相关介绍第19-21页
     ·集中式调度器第19-20页
     ·分布式调度器第20页
     ·分层式调度器第20-21页
   ·本章小结第21-23页
第三章 支持 GPU 的 Torque 集群平台的扩展第23-41页
   ·Torque 概述第23-24页
   ·构建基于 Torque 的异构集群平台第24-26页
     ·硬件平台搭建第24页
     ·软件部署第24-26页
   ·Torque 体系结构和工作流程分析第26-29页
     ·Torque 体系结构第26-28页
     ·Torque 工作流程分析第28-29页
   ·Torque 的源码分析第29-36页
     ·关键数据结构分析第29-32页
     ·调度模块的分析第32-36页
     ·Torque 作业调度的缺陷与不足第36页
   ·支持 GPU 的 Torque 系统的扩展第36-40页
     ·GPU 资源的获取和保存第36-39页
     ·作业请求 GPU 资源的解析第39页
     ·节点筛选时增加对 GPU 资源的匹配第39-40页
   ·本章小结第40-41页
第四章 面向异构集群的自学习调度算法设计与实现第41-53页
   ·算法提出的背景及意义第41页
   ·问题描述和相关定义第41-42页
     ·问题描述第41-42页
     ·相关概念的定义第42页
   ·面向异构集群的自学习调度算法的设计第42-44页
   ·关键问题及其解决方法第44-52页
     ·负载信息的采集第44-45页
     ·性能的统一化描述第45-46页
     ·基于剩余性能的任务分配第46-47页
     ·作业的跟踪与记录第47-48页
     ·基于自学习的负载变化估计第48-51页
     ·针对 GPU 作业的特殊考虑第51-52页
   ·本章小结第52-53页
第五章 应用实例与性能评价第53-59页
   ·实验环境第53-55页
   ·实验用例与结果分析第55-58页
     ·实验用例第55-56页
     ·实验结果与分析第56-58页
   ·本章小结第58-59页
第六章 总结与展望第59-61页
致谢第61-63页
参考文献第63-66页

论文共66页,点击 下载论文
上一篇:试验数据管理平台云存储服务的研究与实现
下一篇:基于PCIE的高速存储系统设计